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VECTEIJRS DE CLONAGE ET/OU DEPRESSION 
PREPARATION ET UTILISATION 

La presente invention concerne un nouveau plasmide de levure, ainsi que 
de nouveaux vecteurs de clonage et/ou d'expression derives de celui-ci, leur 
5 preparation et leur utilisation, notamment pour la production de proteines 
recornbinantes. L'invention concerne aussi les cellules hotes recombinees contenant 
de tels vecteurs. 

Plus particulterement, la presente invention concerne tout ou partie d'un 
nouveau plasmide isole & partir de la levure Kluyveromyces waltii ou d'un derive 
10 de celui-ci, et les vecteurs de clonage et/ou depression construits a partir de 
celui-ci. 

Au cours des dix dernieres annfees, la levure est apparue comme un 
microorganisme bote tres prometteur pour la production de proteines heterologues. 
En particulier, la mise en Evidence par Beggs et al (Nature 275 (1978) 

15 104) du plasmide 2\x et de vecteurs derives de celui-ci a ete Tune des cles du 
developpement actuel de 1'etude genetique et moleculaire de la levure 
Saccharomvces cerevisiae . Depuis, le syst&ne 2^ a permis d'introduire et 
d'exprimer des g&ies heterologues dans la levure afin d'obtenir des proteines 
d'interet pharmaceutique ou agro-alimentaire. Cependant, le plasmide 2ji et ses 

20 derives ne peuvent se repliquer efficacement que dans les levures appartenant a 
Tespece S.cerevisiae et a quelques especes proches de celle-ci. Ce syst&ne ne peut 
done pas etre utilise pour la manipulation genetique dans la plupart des especes de 
levure. Notamment, il n'est pas utilisable dans les levures dont les proprietes 
physiologiques, distinctes de celles de S.cerevisiae- permettraient des applications 

25 nouvelles et/ou des exploitations industrielles plus performantes. 

Differents laboratoires ont done recherche d'autres plasmides dans des 
especes variees de levure. Ainsi, plusieurs plasmides circulaires ont ete trouves 
chez la levure du genre Zvgosaccharomyces. et notamment les plasmides pSRl et 
pSR2 (Toh-e et al., J. Bacteriol. 151 (1982) 1380) ; pSBl, pSB2, pSB3 et pSB4 

30 (Toh-e et al., J. Gen. Microbiol. 12Q (1984) 2527) ; et pSMl (Utatsu et al., J. 
Bacteriol. 162 (1987) 5537). Un plasmide circulaire a 6galement 6t6 trouv6 chez 
Kluweromvces drosophilarum: pKDl (Falcone et al, Plasmid IS (1986) 248). 

Tous ces plasmides presentem des caracteristiques communes avec le 
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plasmide 2ji, et notamment des sequences rfep6t6es inversees, et l'existence sous 
deux formes isomeriques possibles due a un syst&ne de recombinaison site- 
specifique. 

Cependant, ces plasmides presentent toujours Tinconvenient d'avoir un 
5 spectre d'hote etroit Ainsi, en raison de leur specificite vis-a-vis des especes hotes 
de levure, ces plasmides ne peuvent etre utilises que dans un nombre limits de 
souches. 

La presente invention resulte de la mise en evidence d'un plasmide naturel 
de la levure Kluyveromyees waltii . Ce plasmide, nomme pKWl, est le premier 

10 plasmide naturel connu de cette espfece de levure. Purifie & partir de la souche 
K.waltii CBS 6430, ce plasmide a ete cartography au moyen d'enzymes de 
restrictions, et la cane resultante est presentee sur la figure 1. 

Un objet de Tinvention reside done dans le plasmide pKWl isolS a partir 
de la souche K.waltii CBS6430, ou tout fragment ou derivfe de celui-ci. 

15 Par derive, on entend au sens de Tinvention les plasmides qui, en depit de 

quelques modifications, conservent les proprietes du plasmide de depart. 
Notamment, les modifications peuvent prendre la formei de mutations ou de 
deletions portant sur des regions d ! une importance relative. II peut s'agir ^galement 
d'insertions ou de suppressions, comme par exemple de sites de clonage, 

20 Par fragment de pKWl, on entend notamment les differents elements 

genetiques de ce plasmide. Plus pref&rentiellement, comme elements g&ietiques de 
pKWl, on peut titer notamment les genes de structure ou des parties de ceux-ci, 
des sequences promotrices fonctionnelles, les sequences repetees inversees (IR), ou 
encore les sequences permettant la r&plication (origine de replication) ou conferant 

25 la stabilite au plasmide (locus de stabilite). 

En effet, Tetude structurale du plasmide pKWl a permis de mettre en 
evidence des analogies avec le plasmide 2\i de S.cerevisiae. Ainsi, 4 gdnes de 
structure ont 6te mis en evidence (voir figure 2), ainsi qu'une origine de replication. 
Par ailleurs, le clonage de pKWl dans E. coli a permis d'isoler 4 types de plasmides 

30 recombines, correspondant a 2 formes isomeriques du plasmide pKWl (les formes 
A et B) clonees dans le vecteur pKan21 dans les deux orientations possibles (le 
vecteur pKan21 est decrit dans Texemple 3.1). Ces deux formes sont representees 
sur la figure 1. L'existence de deux formes isomeriques indique la presence de 
sequences rep6t6es inversees. L*etude a ainsi montr6 que le plasmide pKWl 
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contient une paire de sequences r6p6tees inversees de 0,3 kb chacune, et deux 
sequences uniques de 2,5 et 2,3 kb ( dont l'orientation distingue Ies 2 formes 
isomeriques A et B. La taille moleculaire du plasmide pKWl est done de 5,5 kb 
environ. Differents sites de restriction ont 6te mis en evidence et, a titre d'exemple, 
5 les sites upiques suivants : EcoRI, SphI, Sail, Clal, Nhel et BgU. 

La sequence nucleotidique complete du plasmide pKWl a Sgalement 6te 
determinee (figure 3). L'absence d'homologie entre cette sequence et celle de 
plasmides connus a et6 demontree, notamment par des experiences d'hybridation 
(voir exemple 2). L'absence d'hybridation en conditions de stringence mod&rfe est 
10 caractferistique de cette difference de sequence. 

Dans un mode prefer^, Tinvention a pour objet un plasmide comprenant 
tout ou partie de la sequence presentee & la figure 3 ou d'un derive de celle-ci. 

Par ailleurs, la Demanderesse a egalement montre qu'il est possible 
d'utiliser le plasmide pKWl ou des fragments de celui-ci pour construire des 
15 vecteurs de clonage et/ou d'expression particulierement stables. 

Un autre objet de la prfcsente invention reside done dans des vecteurs de 
clonage et/ou d'expression caract&ises en ce qu'ils comprennent tout ou partie du 
plasmide pKWl de K.waltii CBS 6430 represent a la figure 1, ou d'un derive de 
celui-ci. 

20 Un objet plus particulier de l'invention consiste en un vecteur de clonage 

et/ou d'expression caracterise en ce qu'il comprend un element g£n6tique au moins 

du plasmide pKWl. 

En raison du spectre d'hote du plasmide pKWl, les vecteurs de l'invention 

peuvent etre utilises dans des especes autres que l'hote naturel K. waltii . 
25 lis peuvent notamment etre utilises pour la transformation d'espSces ti£s 

variees, notamment d'esptees de levures. 

Differents types de vecteurs ont &e construits a partir de pKWl, differents 

au niveau de la taille du fragment provenant de pKWl, et done des §16ments 

fonctionnels issus depKWl. 
M Un objet encore plus particulier de l'invention consiste en tin vecteur de 

clonage et/ou d'expression caracterise en ce qu'il comprend Torigine de implication 

du plasmide pKWl. 

D'autres constructions peuvent etre prepares, comenant des fragments 

plus ou moins importants, permettant d'fitudier l'influence des differents 616ments 
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de pKWl sur la stabilite des vecteurs, leur specificite d'hote, et leur efficacite pour 
1'expression de genes heterologues. En particulier, des vecteurs d'expression 
peuvent etre elaborSs a partir des differents elements genetiques du plasmide pKWl 
(origine de replication, sequences repetees inversees, g£nes de structure, regions 
5 promotrices ..), que Ton peut introduire dans des plasmides connus pour ameliorer 
leurs performances ou leur conferer de nouvelles proprietes. De la meme f agon, des 
vecteurs peuvent etre obtenus en ajoutant des elements au plasmide pKWl, ou en 
remplagant certains elements genetiques de pKWl par des elements provenant 
d'autres plasmides. Ainsi, des vecteurs peuvent etre obtenus en substituant par 
10 exemple Torigine de replication de pKWl par Torigine de replication du plasmide 
2[i de S. cerevisiae ou du plasmide pKDl de Kluyveromvces . ou par un replicon 
chromosomique (ARS) d'une levure (exemple KARS de K.lactis) . De la meme 
fagon, des vecteurs peuvent etre obtenus en substituant le locus de stabilite de 
pKWl par celui du plasmide 2\i de S. cerevisiae ou du plasmide pKDl de 
15 Kluyveromvces . II peut etre particulierement interessant de realiser des vecteurs 
hybrides comprenant des elements des plasmides pKDl et pKWl. 

Avantageusement, les veaeurs de l'invention comj^ennent rint£gralit6 du 
plasmide pKWl tel que represents a la figure 1. 

Preferentiellement, les vecteurs de rinvention comprennent le plasmide 
20 pKWl linearise a un site de restriction fonctionellement neutre. 

Par site de restriction fonctionellement neutre, on entend au sens de la 
presente invention un site de restriction au niveau duquel il est possible d'inter- 
rompre la structure du plasmide sans altfirer ses proprietes de replication et de 
stabilite. 

25 En particulier, il peut s'agir de sites presents sur le plasmide pKWl . A titre 

d'exemple, on peut citer notamment les sites Clal(l); Pstl(4608); ou EcoRV(3072) 
tels que representes sur la figure 1. 

II peut egalement s'agir de sites introduits artificiellement sur le plasmide 
pKWl, ou rendus uniques. Dans ce cas, les sites sont preferentiellement introduits 
30 dans des regions interggniques du plasmide, et notamment dans la region situee 
entre les genes B et D ou dans celle situee entre le gene D et TIR2. 

Avantageusement, selon la presente invention, le plasmide pKWl est 
linearis^ au niveau d'un site de restriction unique. 

Un site particulierement interessant a cet 6gard est le site unique Clal 
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localise en position 1 sur la figure 1. La Demanderesse a en effet montre que ce site 
permettait d'utiliser le plasmide pKWl pour construire les vecteurs de clonage et/ou 
d'expression, en introduisant a ce niveau, par exemple. des fragments d'ADN 
heterologue, tout en maintenant la replication stable du vecteur obtenu. Ce resultat 
est surprenant dans la mesure ou le site Clal est localise dans le gene de structure B. 

L'utilisation de tels sites de clonage neutres permet done d'obtenir des 
vecteurs tres stables, capables de se maintenir dans les cellules transformees, meme 
en l'absence de toute pression de selection. 

Avantageusement, les vecteurs de l'invention contiennent en outre une 
sequence d'ADN heterologue comprenant un gene de structure au moins, sous le 
controle de signaux permettant son expression. 

Les signaux permettant l'expression du ou des genes de structure peuvent 
itre constitute par un ou plusieurs elements choisis parmi les promoteurs, les 
terminateurs ou les signaux de secretion. II est entendu que ces signaux sont choisis 
15 en fonction de I'hdte utilise, du gene de structure et du resultat recherche. En 
particulier il peut Itre preferable dans certains cas d'utiliser un promoteur regulable, 
permettant le decouplage entre les phases de croissance de lTiote et d'expression du 
ou desdits genes de structure. De meme, l'utilisation d'un peptide signal (signal de 
secretion) peut permettre d'augmenter les taux de production de la proteine 
20 recherchee. et f aciliter l'etape de purification. 

Preferentiellement, les promoteurs utilises sont derives de genes de levure. 
D'un interSt tout particulier sont les promoteurs derives de genes glycolytiques des 
levures du genre Saccharomycff? ou kluwerfvniv^ Notamment. on peut citer les 
promoteurs des genes codant pour la phosphogJycerate kinase de S.cerevis™* 
25 (EfiK). la Glyceraldehyde-3-phosphate deshydrogenase (GPP) , les enolases 
(EHOJ, ou les alcool-deshydrogenases (AJ2H). On peut egalement citer des 
promoteurs derives de genes fortemem exprimes tels que le gene de la lactase 
(LA£4) ou de la phosphatase acide (PHO$) . 

Par ailleurs, ces regions peuvent Itre modifiees par mutagenese. par 
30 exemple pour ajouter des Elements supplemental de contrdle de la transcription, 
tels que notamment des regions UAS ("Upstream Activating Sequence"). 

Le gene de structure qui peut etre introduit dans les vecteurs de l'invention 
code preferentiellement pour un polypeptide d'interfit pharmaceutique ou 
agroalimentaire. A titre d'exemple, on peut citer les enzymes (tels que notamment 
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la superoxide dismutase, la catalase, les amylases, les lipases, les amidases, la 
chymosine etc.), les derives sanguins (tels que la serum-albumine, 1'alpha- ou la 
b&a-globine, le facteur VIE, le facteur IX, le facteur van Willebrand, la 
fibronectine, 1'alpha- 1 antitrypsine etc.), Tuisuline et ses variants, les lymphokines 
5 [telles que les interleukines, les interferons, les facteurs de stimulation des colonies 
(G-CSF, GM-CSF, M-CSF...), le TNF, le TRF etc.], les facteurs de croissance (tels 
que lliormone de croissance, Terythropoietine, le FGF, l'EGF, le PDGF, le TGF 
etc.), les apolipoproteines, ou encore des polypeptides antigeniques pour la 
realisation de vaccins (hepatite, cytomegalovirus, Eppstein-Barr, herpes etc.). 
10 Dans un mode particulier de realisation de Tinvention le gSne de structure 

peut etre un gene resultant de la fusion de plusieurs sequences d'ADN. II peut s'agir 
notamment d'un gene codant pour un polypeptide hybride, contenant par exemple 
une partie active associ6e a une partie stabilisatrice. A titre d'exemple, on peut citer 
les fusions entre l'albumine ou des fragments d'albumine et un recepteur ou une 
15 partie d'un recepteur de virus (CD4, etc.). 

Dans un autre mode de realisation, la sequence d'ADN heterologue peut 
comprendre plusieurs genes de structure, et notamment de? genes intervenant, au 
niveau genetique ou biochimique, dans la biosynth&e d'un metabolite. Le 
metabolite peut en particulier etre un antibiotique, un acide amine ou une vitamine. 
20 Dans un mode particulier de realisation, les vecteurs de I'invention 

contiennent en outre : 

- un replicon E.coli et/ou 

- au moins un marqueur de selection. 

Ces elements permettent de manipuler de maniere beaucoup plus aisee les 
25 vecteurs de Tinvention. 

Un autre objet de Tinvention concerne les cellules recombinees contenant 
un vecteur tel que d6f ini ci-avant 

Les cellules recombinees sont preferentiellement choisies parmi les 

levures. 

30 La Demanderesse a montre que les vecteurs de I'invention pouvaient en 

effet gtre utilises aussi bien dans K.waltii (rhdte naturel de pKWl) que dans des 
levures d'especes ou meme de genres differents. Notamment, ils peuvent etre 
utilises dans d'autres Klvuveromyce^ ou dans Saccharomyces. Par ailleurs, lorsque 
la souche K. waltii CBS6430 est utilisee comme cellule hote, des recombinaisons 
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homologues entre les vecteurs de l'invention et le plasmide pKWl resident peuvent 
affecter la stability des vecteurs, et ainsi diminuer les performances du couple 
hote/vecteur. Afin d'ameliorer encore la stabilite des vecteurs de l'invention dans un 
tel couple hote/vecteur, la demanderesse a prepare une souche K. waltii pKWl* 
5 (KW18). Cette souche permet d'optimiser l'utilisation industrielle des vecteurs de 
l'invention (voir exemple 4). 

Differentes techniques peuvent etre utilisees pour introduire les vecteurs 
de l'invention dans les cellules notes. En particulier. la transformation (Bianchi et 
al., Curr. Genet. 12 (1978) 185) et 1'electroporation (Delorme. Appl. Environ. 
10 Microbiol. 155 (1989) 2242) donnent de bons resultats. II est clair toutefois que 
l'invention n'est pas limitee a une technique particuliere. 

Un objet de l'invention reside egalement dans un procede de preparation 
d'un polypeptide selon lequel on cultive une cellule recombinee telle que definie 
plus haut et on recupere le polypeptide produit Plus particulierement, le precede de 
15 l'invention permet la production de proteines d'interet pharmaceutique ou 
agroalimentaire, telles que celles indiquees ci-avant Plus specifiquement, le 
procede de l'invention est adapte a la production d'albumine humaine et de ses 
variants ou precurseurs. 

Dans le cas ou les genes de structure interviennent dans la biosynthese d'un 
20 metabolite, les cellules recombinees peuvent egalement etre utilisees directement 
dans un procede de bioconversion. 

D'autres avantages de la presente invention apparaitront a la lecture des 
exemples qui suivent, qui doivent etre consideres comme Ulustratifs et non 
limitatifs. 

25 LEGENDF. DFS FTfrTIP^ 

Figure 1 : Carte de restriction du plasmide pKWl. Les sequences repetees inversees 
ainsi que les genes de structure A-D sont indiques. Les positions indiquees pour les 
sites de restriction correspondent au premier nucleotide reconnu par I'enzyme. 
Figure 2 : Etude des phases ouvertes du plasmide pKWl. Les elements genetiques 
30 indiques sont localises aux positions suivantes par rapport a la sequence presentee 
figure 3 : Gene A : nucleotides 1454 a 2755 ; Gene B : nucleotides 4948 a 54 ; 
Gene C : nucleotides 389 a 1309 sur le brin complementaire ; Gene D : nucleotides 
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3444 a 4313 sur le brin comptementaire ; IR1 : nucleotides 53 a 368 ; IR2 : 
nucleotides 2713 a 3028. 

Figure 3 : Sequence nucleotidique du plasmide pKWl. La sequence representee 
correspond a la forme B du plasmide. La position 1 correspond au premier 
5 nucleotide de la sequence reconnue par 1'enzyme Clal. Le plasmide pKWl a et6 
fragmente par des enzymes de restriction et les fragments ont ete clones dans 
pTZ18R (Pharmacia). Les sequences des segments clones ont ete d&erminees par 
la methode de Sanger sur les 2 brins. 

Figure 4 : Cartes de restriction des plasmides navettes YIPS et pKan21. Ap : Gene 
10 de resistance a 1'ampicilline ; Tc ; Gene de resistance a la tetracycline ; Km : Gene 
de resistance a la kanamycine (G418) ; LacZ : Gene de structure de la B-galactosi- 
dase. 

Figure 5 : Strategie de construction des vecteurs pBNAl, pNEA2, pBNBl/A3, 

pNEBl, pXXY2 et pXXK3. Voir aussi tableau 1. 
15 Figure 6 : Carte de restriction du vecteur pXXK3* 

Figure 7 : Strategie de construction des vecteurs pKWCll, pKWSl et pKWS14. 

Figure 8 : Etude de la stability des vecteurs pKWCll et p^XK3 dans la souche 

K.waltii KW18- Dans chaque cas, un clone transforme a ete cultive en milieu YPG 

non selectif pendant le nombre de generations indique, puis des aliquots de culture 
20 ont ete etales sur boites de milieu YPG gelose avec et sans G418, afin de 

determiner le nombre total des cellules et le nombre de cellules resistant d G418. La 

stabilite correspond au % de cellules resistames. 

Figure 9 : Strategie de construction du vecteur d'expression pXPHOS. 
Abreviations : P = promoteur, T = terminateur, ss = signal de secretion, CIP = Calf 
25 Intestinal Phosphatase, Km = kanamycine, E = EcoRI, H = Hindlll, S * Sail, B = 
BamHI, Sm = Smal. 

Figure 10 : Canes de restriction des vecteurs pXKN18 et pXPHOS. L6gende : voir 
figure 9. 

Figure 11 : Detection immunologique de 1'ILIB produite par K.waltii. Les mar- 
30 queurs de poids moleculaire (KDa) som indiques a gauche, Puits 1 : IL-1B de 
reference (100 ng) ; Puits 2 : Surnageant de culture du transformant pXKN18 (sans 
cassette IL-1B) ; Puits 3 : Surnageant de culture du transformant pXPHOS traitS par 
l'endo-N- acetylglucosamidase H ; Puits 4 et 5 : Surnageants des cultures des 
transform ants pXPHOS en milieu LPi et HPi respectivement 
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Figure 12 : Strategic de construction du plasmide pYG65. 
Figure 13 : Strategic de construction du plasmide pYG70. 

Figure 14 : Strategic de construction du plasmide pYG14L ajtfi : gene codant pour 
Taminoglycoside 3'-phosphotransferase, conferant la resistance a la kanamycine; 
5 fcla : gene codant pour la B-lactamase conferant la resistance a I'ampicilline. 
Figure 15 : Strategic de construction du plasmide pYG142. 
Tableaux 1 et 2 : Composition de vecteurs derives de pKWl selon I'invention. (*) 
Sites de clonage. 

Tableaux 3, 4 et 5 : Transformation par des vecteurs de 1 'invention respectivement 
10 de S.cerevisiae. K.W9ltij et de differentes souches de Kluweromyees . La stabilite 
des transformants est exprimee par le pourcentage de cellules Ura+ apres 10 gene- 
rations de croissance dans le milieu non-selectif YPD. Les souches isonucleaires 
K.waltii pKWl+ et pKWj- sont CBS 6430 et KW18 respectivement. 

TECHNIQUES GRNRB A LES DE CLONAGF. 

15 Les m&hodes classiques de biologie moteculaire telles que la centri- 

fugation d'ADN plasmidique en gradient de chlorure de cesium - bromure d'ethi- 
dium, la digestion par les enzymes de restriction, Telectrophorese sur gel, Felec- 
tro&ution des fragments d'ADN k partir de gels d*agarose, la transformation dans 
££OlL etc, sont decrites dans la litterature (Maniatis et al., "Molecular Cloning : a 

20 Laboratory Manual", Cold Spring Harbor Laboratory, Cold Spring Harbor, N.Y., 
1986 ; Ausubel et al.. (eds.), "Current Protocols in Molecular Biology", John Wiley 
& Sons, New York 1987). 

La mutagenese dirigee in vitro par oligodesoxynucleotides est effectuee 
selon la methode developpee par Taylor et al. (Nucleic Acids Res. 12 (1985) 8749- 

25 8764) en utilisant le kit distribue par Amersham. Le sSquengage de nucleotides est 
realise selon la technique des dideoxy decrite par Sanger et al. (Proc. Natl. Acad. 
Sci. USA, 2A (1977) 5463-5467). ^amplification enzymatique de fragments 
d'ADN specifiques est effectute par reaction de PCR CPolymerase-catalyzed Chain 
Reaction") dans les conditions decrites par Mullis et Faloona (Meth. Enzym., 155 

30 (1987) 335-350) et Saiki et al (Science 22Q (1985) 1350-1354), en utilisant un 
"DNA thermal cycler" (Perkin Elmer Cetus) en suivant les recommandations du 
fabricant 
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EXAM PLE S 

1) Isolement et purification de pKWl 

La souche CBS 6430 est cultivee dans 2 litres de milieu YPG (Yeast 
extract 1 %, Bactopeptone 1 %, Glucose 2 %) avec agitation a 26°C pendant envi- 
5 ron 18 heures. Les cellules en phase stationnaire precoce sont recoltees par centri- 
fugation. On obtient habituellement 13 a 15 grammes de masse cellulaire par litre. 
Les cellules sont lavees avec 150 ml de sorbitol 1M contenant 30 mg de Zymolyase 
20T (Kirin Breweries Co., Tokyo). Apres incubation a 30°C pendant 1 heure, on 
ajoute i la suspension de protoplastes 5 ml de sodium dodecylsulfate a 10 % et 
10 5 ml de EDTA a 0,5M, pH 7,0. Le melange est immSdiatement agite 
vigoureusement, et incube a 50°C pendant 1 a 2 heures. On ajoute au lysat Tacetate 
de potassium a la concentration finale de 1 M et le melange est maintenu dans la 
glace pendant 2 heures. Les precipites formes sont elimines par centrifugation 
(Sorvall SS34, 15 000 tpm, 30 minutes). Le surnageant auquel 2 volumes Methanol 
15 a 95 % sont ajoutes est refroidi dans la glace afin de precipiter les acides 
nucleiques. Les precipites sont collectes par centrifugation; laves avec Tethanol a 
70 %, seches sous vide, et enfin dissouts dans 40 ml de 5 x TE (Ix TE est Tris-HCl 
10 mM, EDTA ImM, pH 8). Apres addition de 40 g de CsCl et 5 ml de bromure 
d'ethidium (solution stock de 10 mg/ml), le melange est centrifuge a 60 000 tpm 
20 pendant 6 heures (Beckman, rotor 60 Ti). La bande fluorescente de TADN 
plasmidique se trouve au-dessous de la bande majeure d'ADN chromosomique. 
L'ADN du plasmide est collecte et soumis au second cycle de centrifugation dans 
CsCl/bromure d'ethidium. L'ADN plasmidique collecte est melange avec un 
volume d'isopropanol prealablement equilibre avec CsCl 4M pour eliminer le 
25 bromure d'ethidium. Apres plusieurs extractions par 1'isopropanol, la solution 
d'ADN est dialys6e contre 1 x TE. Le volume de la solution peut etre reduit par 
dialyse contre le polyethylene-glycol 6 000 en paillettes. 

2) Sequencage et etudes d'homologies 

Le plasmide pKWl a ete sequence en utilisant la methode decrite par 
30 Sanger et al (Proc. Natl. Acad. Sci. USA 14 (1977) 5463-5467). La sequence com- 
plete est indiquee sur la figure 3. 

L'absence d'homologie entre cette sequence et celle de plasmides connus a 



1 1 

ete determinee par des experiences d'hybridations moleculaires : pKWl est marque 
au ^ 2p » et hybride avec les plasmides suivants, prealablement immobilises sur un 
filtre de nitrocellulose : 

- plasmide 2|a de S. cerevisiae. 

- pSRl, pSB3 et pSB4 de Z. rouxii . 

- pSBl et pSB2 de Z. bailii. et 

- pKDl de K. drosophilarum 

^hybridation a ete realisee dans des conditions de stringence moderee (0,6 
M Na+, 65°C, 18 heures); aucun des plasmides n'a donne un signal positif 
d'hybridation. 

Les autres plasmides circulaires (pSBl, pSB4) dont les sequences n'ont pas 
encore ete decrites, sont egalement differems de pKWl, par la taille moleculaire, 
par la longueur des repetitions inverses et par leurs especes hdtes. 

3) Construction de vecteurs de clonage d erives de pKWl . 

Deux types de molecules recombinees ont ete construits a partir de pKWl. 

3.1. Dans le premier type, differems fragments de pKWl (correspondant 
par exemple aux elements genetiques de pKWl) ont ete intnxluits dans des 
vecteurs navette, et notamment dans les vecteurs Ylp5 (Struhl et al., Proc. Nat. 
Acad. Sci USA 26 (1979) 1035) et pKan21 , representes sur la figure 4. 

Le plasmide pKan21 a ete construit par insertion du gene aph (Genblock, 
Pharmacia) conferant la resistance a la kanamycine (G418) sous forme d*un 
fragment AccI de 1,25 kpb, dans le site Narl du plasmide pUC19 (Viera et 
Messing, Gene 12 (1982) 259). pKan21 contiem done, en plus de ach, le gene fcla 
conferant la resistance a Tampicilline et l'origine de replication de ColEl 
permettant la replication dans E. Coli. Les levures transformees par les vecteurs 
derives de pKan21 peuvent etre detectees par leur croissance sur milieu contenant 
200ng/ml de gen^ticine (G418). 

Le plasmide YIp5 est un derive du plasmide pBR322 dans lequel le gene 
I2RA2 de SiCereviaag a ete insere comme marqueur de selection. La levure 
transformee par les derives de YIp5 est detectee par sa croissance sur un milieu 
sans uracile. Dans ce dernier cas, la levure hote est une auxotrophe deficiente en 
orotidine-monophosphate carboxylase de la voie de synthese de 1'uracile. 
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Les vecteurs de ce premier type sont pBNAl, pNEA2, pBNBl/A3 f 
pNEBl, pXXY2 et pXXK3 (tableau 1 et figure 4). 

- VecteurpBNAl 

pKWl a &e digerS par Bglll et Nhel (Cf figure 5) et les fragments d'ADN 
5 sont separes par electrophorese. Le fragment de 2,4 kpb est recupere et insere par 
ligation entre les sites uniques BamHI et Nhel dans le gene de resistance a la 
tetracycline du plasmide YIp5 (Yanish-Peron et aL, Gene 33, 1985, 103-119), 
celui-ci etant prealablement digere par BamHI et Nhel et repurifie. Les extremites 
Bglll et BamHI sont compatibles pour ligation specifique. E. coli transforme par le 

10 melange de ligation est selectionne sur le milieu LB gelose contenant l'ampicilline. 
L'insertion est verifiee par la r6plique des transformants sur le milieu LB gelose 
contenant la tetracycline, ceux-ci etant sensibles a cet antibiotique. La structure du 
plasmide est verifiee par extraction de l'ADN a partir de transformants individuels 
et son analyse par les enzymes de restriction. A titre d'exemple, le plasmide pBNAl 

15 digere par PstI produit 3 fragments de 3,28, 3,15 et 1,36 kpb : la double digestion 
Pstl/Nhel donne 4 fragments de 3,15, 2,3, 1,36 et 1 ,0 kpb. 

- Vecteur pNEA2 ^ 

Le fragment Nhel-EcoRI de 2,0 de pKWl (Cf figure 5) est isolS et insere 
entre les deux sites uniques Nhel et EcoRI dans le gene de resistance a la 

20 tetracycline de YIp5, celui-ci etant prealablement digere par ces deux enzymes. Le 
produit de ligation est introduit dans E. coli. et les transformants resistants a 
rampicilline et sensibles a la tetracycline sont isoles. Le plasmide est isole comme 
dans le cas de pBNAl a partir de Tun de ces transformants. La structure du 
plasmide recombine obtenu est verifiee par restriction. A titre d'exemple, la 

25 digestion par PstI produit 2 fragments de 4,35 et 3,15 kpb; la double digestion par 
Pstl/Xhol produit 4 fragments de 3,15, 1,8, 1 ,75 et 0,7 kpb. 

- Vecteur pXXY2 

Le fragment Xhol-Xbal de 545 pb de pKWl (Cf figure 5) est isole et 
insere entre les sites uniques Sall-Nhel dans le gene de resistance a la tetracycline 
30 du plasmide YIp5. Les extremites Xhol et Sail, d'une pan, et Xbal et Nhel, d'autre 
pan, sont compatibles pour ligation specifique. Le produit de ligation est introduit 
dansfLcoli. et le plasmide recombine est isole comme dans le cas de pBNAl. La 
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structure du plasmide obtenu est verifiee par restriction. A titre d'exemple, la 
digestion par EcoRI + Nrul produit deux fragments de 4.5 et 0,96 kpb. 

- Vecteur pXXK3 

Le fragment Xhol-Xbal de 545 pb de pKWl (Cf figure 5) est isole et 
5 insere erttre les sites uniques Sall-Xbal (polylinker au N-terminal de LacZ) du 
plasmide pKan21. Le melange de ligation est introduit dans E.coli . et les trans- 
formants. etales sur le milieu LB contenant X-gal et IPTG, sont isoles comme 
colonies blanches parmi les bleues. Repliquees sur le milieu LB contenant la 
kanamycine, elles croissent bien. Ces colonies sont individuellement analysees pour 
10 leur contenu en plasmide. Le plasmide obtenu a partir de I'un des transformants 
presente la structure montree dans la figure 6, verifiee par restriction. A titre 
d'exemple, la digestion par BamHI + PstI produit quatre fragments 2,5, 1,3, 0,55 et 
0,19 kpb. 

- Vecteur pBNBl/A3 

15 Le fragment Bglll-Nhel de 1,9 kpb de pKWl (Cf figure 5) est isole et 

insere entre les sites BamHI-Nhel de YIp5. Le plasmide recombine - est isol6 
comme dans le cas de pBNAl. La structure du plasmide est verifiee par restriction. 
A titre d'exemple, la digestion par PstI produit 3 fragments de 3,15, 2,8 et 1,36 kpb 
; la double digestion par Pstl/Nhel produit 4 fragments de 3,15, 1,8, 1,36 et 1,0 

20 kpb. 

- Vecteur pNEBl 

Le fragment Nhel-EcoRI de 2,5 kpb de pKWl (Cf figure 5) est isole et 
insere entre les sites Nhel-EcoRI de YIp5. Le plasmide recombine est isole comme 
dans le cas de pBNAl. La structure du plasmide est verifiee par restriction. A titre 
25 d'exemple. la digestion par PstI produit 2 fragments de 4,65 et 3,15 kpb ; la double 
digestion par Pstl/Xhol produit 3 fragments de 3,15, 2.9 et 1 ,75 kpb. 

3.2. Le deuxieme type de molecules recombinees contient la totalite de la 
sequence de pKWl. Pour obtenir ces vecteurs, pKWl est linealise par coupure 
unique a un site de restriction, permettant d'introduire des segments d'ADN 
30 h&eroJogue. De tels segments peuvent contenir des genes de structure, inclus par 
exemple dans des cassettes d'expression. et/ou des vecteurs navettes entiers. tels que 
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notammentpKan21 ou YIp5 (figure 4). 

Les exemples de ce type de vecteurs sont pKWCll. pKWSl et pKWS14 
(tableau 2 et figure 7). 

- vecteur pKWS14 

5 L'ADN de pKWl a ete digere par l'enzyme de restriction Sail. Le 

plasmide pKan21, decrit plus haut, est digere aussi par Sail (le site unique Sail est 
localise dans le multisite de clonage present dans le gene LacZ). Les deux plas- 
mides sont ligatures par l'ADN-ligase. Le melange de ligation est utilise pour la 
transformation de E. coli J M83 cornme dans le cas precedent La suspension des 

10 cellules transformees est etalee sur LB gelose contenant X-gal et IPTG. Les 
colonies blanches, parmi les bleues, sont recuperees individuellement. Elles sont 
resistantes a Tampicilline et a la kanamycine. Leur contenu en plasmide est analyse 
sur les mini-preparations d'ADN comme precedemment. Le plasmide, pKWS14, 
isole a partir de Tun des transformants, contient la forme A du plasmide pKWl et 

15 possede la structure montrge dans la Figure 7. Elle est verifiee par restriction. A 
titre d'exemple, la digestion par BamHI produit 3 fragments de 5,6, 2,6 et 1,2 kpb. 

\ ■ 

- Vecteur pKWCll 

Le plasmide pKWl est digere par Clal. Le plasmide pKan21 est digere par 
Accl. lis sont repurifies par traitement au phenol et precipitation par Sthanol. Les 

20 ADN des deux plasmides sont melanges en quantites approximativement egales et 
soumis a la reaction de ligation par TADN-Iigase pendant une nuit. Le produit de 
ligation est amplifie dans E. col? . Les colonies des transform ants sont blanches sur 
le milieu LB contenant Xgal et IPTG. Elles sont resistantes a la kanamycine et 
l'ampicilline sur le milieu contenant Tun ou l'autre de ces antibiotiques. Le 

25 plasmide, pKWCll, isole a partir de Tun des transform ants, contient la forme A du 
plasmide pKWl et possede la structure montree dans la Figure 7. Elle est verifiee 
par restriction. A titre d^xemple, la digestion du plasmide par BamHI produit 3 
fragments de 5,6, 2,9 et 0,9 kpb. 

- Vecteur pKWSl 

30 Le plasmide pKWl et le plasmide YIp5 sont diger& par Sail. Le melange 

est repurififi et soumis a la reaction de ligation. Le produit de ligation est introduit 
dans E. coli. Des transformants resistants k Tampicilline et sensibles a la 
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tetracycline, sont obtenus. Le plasmide, pKWSl, isole a partir de l'un d'entre eux, 
contient la forme A du plasmide pKWl et possede la structure montree dans la 
Figure 7. A titre d'exemple, la digestion du plasmide par EcoRI donne deux frag- 
ments de 8,3 et 2,7 kpb. 

4) Construction ri'iihe souche CR S 6410 pKWT 

ILwaJlii CBS 6430 a d'abord ete transformee par le plasmide recombinant 
pKWSl4 (tableau 2 et figure 7). La methode de transformation utilisee est 
essentiellement celle decrite par Chen et Fukuhara (Gene 69. 181 (1988)) utilisant 
les protoplastes. Les transformants obtenus sont maintenus pendant 75 generations 
sur milieu YPD-agar 1 mg/ml G418 (Milieu YPD : extrait de levure 10 g/1 ; 
peptone 20 g/1 ; glucose 20 g/1). lis som ensuite transferes sur milieu YPD liquide 
sans antibiotique et maintenus pendant 10 generations. 

Dans ces conditions (sans pression selective), le plasmide pKWS14 est 
progressivement perdu. Les colonies sensibles a G418 qui apparaissent sont 
15 prelevees et testees individuellement pour la presence des plasmides. Le test 
consiste en extraction de 1'ADN cellulaire, suivie d'une electrophorese de ces ADNs 
sur un gel d'agarose. La presence de plasmides est revelee par coloration au 
bromure d'ethidium. Parmi les colonies qui sont devenues sensibles a G418, 25 % 
se sont revelees demunies de tout plasmide. Une de ces colonies a ete gardee 
20 comme souche de K, wallii depourvue de plasmide pK Wl et designee KW18. 

5) Transformation rig riiffcrentes lovuroc 

5.1. Transformation de S.cerevisiap 

Parmi les differents vecteurs decrits dans les tableaux 1 et 2 et aux figures 
4 et 5, certains de ceux contenant le marqueur URA 3 ont ete utDises pour 
25 transformer une souche auxotrophe ml de S.cerevisia* (i a souche S150-2B : Mai 
a, Uia3, ]£u2, mil, hjs3. 2^). 

La methode de transformation est essentiellement celle decrite par 
Sherman et al (Yeast Genetics, Cold Spring Harbor, NY, 1986). 

Les resultais obtenus sont indiques dans le tableau 3. lis montrent que les 
30 vecteurs de 1'invention sont capables de transformer les levures du genre 
Saccharomvees. 
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5.2. Transformation de K.waltii 

La transformation de K.waltii a ere realisee avec des vecteurs portant le 
marqueur de resistance a la kanamycine. 

La methode de transformation utilisee est essentiellement celle decrite par 
5 Chen et Fukuhara (Gene £2 (1988) 181) utilisant les protoplastes. II est clair que 
toute autre technique permettant d'introduire un fragment d ! ADN dans un 
microorganisme peut etre utilisee. 

Les resultats obtenus som presentes dans le tableau 4. 

lis montrent que les vecteurs de Tinvention sont capables de transformer 
10 avec une frequence 61evee la levure K.waltii . 

Par ailleurs, l'etude de stabilite decrite dans la figure 8 montre que des 
vecteurs peuvent etre obtenus a partir de pKWl, presentant une stabilite de 100 % 
apres 50 generations de croissance dans un milieu non selectif. Ceci est 
parfaitement illustre par le vecteur pKWCll. Cette etude montre 6galement qu'il 
15 est preferable, pour obtenir une stabilite relativement elevee, d'utiliser les vecteurs 
ne comportant que I'origine de replication du plasmide pKWl dans des cellules 
hotes possedam un plasmide pKWl resident. 

53. Transformation d'autres levures 

Le vecteur pKWCll, hautement stable et autonome dans K.waltii. a ete 
20 utilise pour tester la transformabilite de differentes especes de levures, et 
notamment celles appartenant au genre Kluweromyces . 

Les resultats sont presentes dans le tableau 5. 

La presence du vecteur pKWCll dans les transfonmants a ete verifiee par 
electrophorese. 

25 L'ensemble de ces resultats montrent que Tetendue des especes hotes des 

vecteurs de Tinvention peut etre tres grande, depassant le genre Kluweromyces. 

6) Utilisation des vecteurs de ^invention pour la production de 

prolines h^roipgu^ 
6.1. Interleukine-IB : 

30 6.1.1. Construction d'un vecteur depression et de secretion de PIL-1B 

derive de pKW 1 (figures 9 et 1 0) . 
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- Le vecteur pXXK3 (tableau 1, figure 6) est linearise par EcoRI et les 
extremites sont comblees avec le fragment Klenow de l'ADN polymerase I de 
E£2li. Un "linker" synthetique (5'-GCGGCCGC-3') formant un site de restriction 
reconnu par 1'enzyme NotI est ajoute au moyen de la ligase T4, et le vecteur ainsi 

5 obtenu (pXKN18) est purifie apres son amplification chez E.coli (figure 10). 

- Une cassette depression de TIL-IB est realisee, composee (a) du 
promoteur regule PH05 provenant de S. cerevisiae (Bajwa et al, Nucl.Acid.Res. 
12, (1984) 7721-7739), (b) du gene de TIL-IB humaine (Jung et al., Ann. 
Inst. Pasteur/Microbiol. 122 (1988) 129-146) precede (c) d'une sequence 

10 synthetique correspondant a la sequence signal de la toxine killer de pGKLl de 
K.lactis (region pre du gene de la sous-unit& alpha) (Stark et Boyd, EMBO J. ,5, 
(1986) 1995-2002), et (d) du terminateur PH05. La cassette d'expression a 6te 
isolee a partir du vecteur pSPH05-IL14 dont la construction est decrite dans le 
brevet EP 361991. La cassette a ete realisee de la mantere suivante : A Textr6mit6 

15 5' du g£ne codant pour la partie mature de TIL- IB est inseree la sequence 
synthetique suivante, sous forme d'un fragment EcoRI : 

MetAsnllePheTyrllePheLeuPheLeuLeuSerPheValGlnGlyLysArg 
S'-AATTATGAATATATTTTACATATTTTTGTTTT^ 

3'-TACrrATATAAAATCTATAAAAACAAAAACGACAGTAAGCAAGTrCCATTTTCTTAA-5 l 

20 demiers codons ajoutes (Lys et Arg) forment un site de coupure 

potentiel reconnu par Tendopeptidase Kexl de K.lactis (Tanguy-Rougeau et al ; 
FEBS Leu. 2M (1988) 464). Cette sequence a 6te fusionnee au gene de TIL-IB par 
le site EcoRI, formant la jonction suivante : 

Gly Lys Arg He His Met Ala 
25 5\...GGT AAA AGA ATT CAT ATG GCA ...S 

L'alanine (GCA) correspond au premier acide amine de TIL-IB mature. 
Arg-Ile-His-Met correspond a un "linker" EcoRI-Ndel introduit pour faciliter le 
clonage (Cf EP361 991). 

L'ensemble de la cassette est mis sous forme d'un fragment NotI par 
30 addition d'un linker correspondant (S'-GCGGCCGCO 1 ). 

- La cassette de secretion de TIL-IB est inserte, au site NotI, dans 
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pXKN18. Le vecteur resultant est appele pXPHOS (figure 10). 

6.1.2. La souche K.waltii CBS 6430 est transformee par le vecteur 
pXPHOS, dans Ies conditions decrites dans I'exemple 5.2. 

6.1.3. Expression de TIL- 18: 

5 Les cellules transformees sont cultivees a 28°C, en absence de G418, dans 

le milieu liquide LPi (a faible teneur en phosphate mineral) et le milieu HPi (a 
haute teneur en phosphate), prepares selon Chen et Fukuhara (Gene £2 (1988) 181- 
192), pendant 4 jours. 50 ml de culture sont centrifuges et les surnageants filtres sur 
membrane Millipore (0,22 |am). Les proteines sont precipitees par addition 

10 d'ethanol a la concentration finale de 60 %. Les precipites sont dissous dans 2 ml de 
tampon de Laemmli (Nature 22Z (1970) 680-685) et 20 \xl d^chantillons sont 
utilises pour l'analyse SDS-PAGE selon Laemmli (document precite). Apres 
electrophorese, les proteines sont transferees sur une feuille de nitrocellulose, et 
traitees par un antiserum polyclonal de lapin ami IL-1B humaine. Le Blot est 

15 ensuite traite avec un 2eme anticorps polyclonal anti-Iapin biotinylg (Vectastain 
ABC ImmunoPeroxydase Kit, Vector Laboratories). L^ complexe antigene- 
anticorps est revele selon le protocole du foumisseur. 

La figure 11 montre qu'une proteine de poids moleculaire apparent de 21 
kDa est secretee par la levure transformee par pXPHOS. La proteine est speci- 

20 fiquement reconnue par Tantiserum anti-IL-18. Cette proteine n'est pas synthetisee 
par la levure transformee par le vecteur de controle pXKN18 (sans cassette IL-1B). 
La proline secretee correspond a la forme glycosyle de TIL-IB, ce qui est 
demontre par la reduction du PM apparent apres traitement par Tenzyme 
endo-N-ac€tylglucosamidase H (figure 11 piste 3). Ce couple hdte/vecteur 

25 ILsallii/pXPHOS, encore non-optimise, secrete approximativement 5 mg 
d'lL-lBpar litre de culture. Le niveau de la secretion d'lL-lfl par K.waltii est plus 
eleve dans le milieu LPi que dans le milieu HPi, ce qui suggere que l'activite du 
promoteur PH05 est regulee par le phosphate dans K.waltii comme dans 



WO 93/00437 



19 



PCT/FR92/00559 



6.2. Serum-albumine humaine : 

6.2.1. Construction du plasmide pYG140 (figures 12-14). 
Un plasmide a et6 construit comprenant: 

- un replicon Ecoli . 

5 . - le gene aph sous controle du promoteur kl de la toxine killer de K.lactis 

(EP361911) dans lequel le site Hindlll a ete eliminl par mutagenese dirigee, et 

- le gene bja., conferant la resistance d 1'ampicilline. 

Le gene aph sous controle du promoteur kl est isole a partir du plasmide 
pKan707 (EP361991) sous forme d'un fragment PstI, qui est clone dans le site 
10 equivalent du phage M13mp7. Le plasmide resultant est appele pYG64 (figure 12). 
Le site Hindlll present dans ce gene a ete d&ruit par mutagenese dirigee selon la 
methode decrite par Taylor et al. (Nucl. Acid. Res. 12 (1985) 8749). Le plasmide 
resultant est appele pYG65. L'oligodeoxynucleotide ayant servi pour la mutagenese 
a la sequence suivante : 5'-GAAATGCATAAGCT£TrGCCATTCTCACCG-3', et 
15 a permis de transformer le triplet CTT codant pour la leucine 185 en CTC. Pour 
construire le plasmide pYG70. la panie contenant le replicon bacterien du vecteur 
pKan707 a 6te isolee par digestion avec I'enzyme EcoRI et recircularisation avec la 
T4 DNA ligase pour obtenir pYG69. Le fragment PstI present dans ce dernier 
vecteur contenant le gene aph. a ensuite'6te remplace par le fragment equivalent 
20 mute provenant de pYG65. Le plasmide resultant est appele pYG70 (figure 13). 

Ce plasmide est ensuite digere par EcoRI et religue en presence d'un 
adaptateur EcoRI-Narl-EcoRI contenant la sequence suivante : 
5'-AATTCGGCGCCG-3'. 

La plasmide obtenu est appele pYG140 (figure 14). 

25 6.2.2. Introduction d'une cassette d'expression de 1'albumine (figure 14). 

Le gene codant pour la preproSAH sous controle du promoteur et du 
terminateur du gene EGK de S.cereYisiae a ete isol6 sous forme d'un fragment Sall- 
SacI i partir du vecteur d'expression pYG19 (EP361991). Ce fragment a 6t6 
introduft dans les sites correspondant du plasmide pYGl40 pour gtoerer le plas- 

30 midepYG141. 
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6.2.3. Construction du vecteur d'expression pYG142 (figure 15). 

Les plasmides pYG141 et pKWl sont dig6res respectivement par les 
enzymes Narl et Clal. Apres ligation, 4 plasmides recombinants sont obtenus, en 
raison de l'existence des 2 formes A et B de pKWl, et de Indentation de la partie 
5 pKWl par rapport a la partie pYG141. 

La figure 15 decrit la cane de restriction d r un de ces 4 plasmides : 
pYG142, contenant la forme B de pKWl. 

Les autres plasmides sont appeles pYGl43, pYG144 et pYG145. 

Un echantillon de la souche K.lactis CBS 6430 a 6te depose au CBS & 
10 Baam (Pays-Bas) selon les conditions du Traite de Budapest le 4 juin 1991 sous le 
numeroCBS 290.91. 
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TABLEAU 1 



VECXEURS 


Fragment 


VECTEUR 


MARQUEUR 






DE PKWl 


navette 




pBNAl 




-Dgiii-iNnei 


Ylp5 


I IT} A "5 

URA3 








* 

BamHI-Nhel 




pNEA2 




Nhel-EcoRI 


YIp5 


URA3 






2.0 kb 


Nhel-EcoRI 




pXXY2 




Xhol-Xbal 


YIp5 


VRA3 






0,55 kb 


Sall-Nhel 




pXXK3 




Xhol-Xbal 


pKan21 


Kan £ 






0.55 kb 


Sall-Xbal 


pBNBl/A3 




Bgllll-Nhel 


YIp5 


URA3 






1.9 kb 


BamHI-Nhel 




pNEBl 




Nhel-EcoRI 


YIp5 


URA3 






2,5 kb 


Nhel-EcoRI 




TABLEAU 2 


VECTEURS 




SITE DE 


VECTEUR 


MARQUEURS 




LINEARISATION DE 


NAVETTE 








PKWl 






pKWS14 




Sail 


pKan21 *{SalI) 


Kan R 


pKWCll 




Gal 


pKan21 (AccI 


Kan R 


pKWSl 




Sail 


YIp5 (Sail) 


URA3 
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TABLEAU 3 



Transformation de Saccharomvces cerevisiae par des vecteurs derives de 

pKWl. 



VECTEURS 


Transformants Ura+ par jig d'ADN 


pKWSl 


4 400 


pBNAl 


1 200 


pBNBl/A3 


7 600 


pXXY2 


4 000 


pSKl 


4 500 



TABLEAU 4 

Transformation de Kluyveromvces waltii par des vecteurs derives de pKWl . 



VECTEURS 


Support de 


Transformants G418-resistants 




replication 


par jig 


d'ADN 






pKWl + 


pKWl' 


pKWCll 


pKWl total 


36 000 


8 000 






(98 9c) 


(100 9c 


pXXK3 


Xbal-Xhol 


35 000 


10 000 




54UbpdepKWl 


(49 9c) 


(2,8 9c) 


pKWS14 


pKWl total 


10 000 


8000 






(92 9c) 


(29%) 
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TABLEAU'S 



Transformation de levures du genre Kluwemmyras 
avec le veaeur pKWCl 1 



Espece 


Souche 


GC% 


Frequence de 
transformation 
par \ig d'ADN 


Stabilite des 
transformants 
(%) 


K.waltii 
K.thermotolerans 


CBS6430 
CBS6340 


45,6 
46,2 


2400 
4000 


100 
25 
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REVENPICATIQHS 

1 - Plasmide pKWl isole a partir de la souche K.waltii CBS6430, ou tout 
fragment ou derive de celui-ci. 

2 - Fragment selon la reveridication 1 caracterisS en ce qu'il s'agit d'un 
5 element genetique. 

3 - Plasmide caracterise en ce qu'il comprend tout ou panie de la sequence 
presentee a la figure 3 ou d'un derive de celle-ci. 

4 - Vecteur de clonage et/ou d'expression caracterise en ce qu'il comprend 
tout ou partie du plasmide pKWl de K.waltii CBS 6430 represents a la figure 1 ou 

1 0 d'un derive de celui-ci. 

5 - Vecteur selon la revendication 4 caracterise en ce qu'il comprend un 
element genetique au moins du plasmide pKWl. 

6 - Vecteur selon la revendication 5 caracterise Ipn ce qu'il comprend 
I'origine de replication du plasmide pKWl. 

15 7 - Vecteur selon la revendication 4 caracterise en ce qu'il comprend 

l'integralite du plasmide pK Wl . 

8 - Vecteur selon la revendication 4 caracterise en ce qu'il comprend tout 
ou partie de la sequence presentee a la figure 3 ou d'un derive de celle-ci. 

9 - Vecteur selon Tune des revendications 4 P 7 ou 8 caracterise en ce que le 
20 plasmide pKWl est linearise au niveau d'un site de restriction fonctionellement 

neutre. 

10 - Vecteur selon la revendication 9 caract6ris6 en ce qu'il s'agit d'un site 
de restriction present sur le plasmide pKWl t ou introduit artificiellement sur 
celui-ci. 

25 1 1 - Vecteur selon la revendication 1 0 caracterise en ce qu'il s'agit d'un site 

de restriction introduit artificiellement dans une region intergSnique, et de 
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preference dans la region situee emre les genes B et D ou dans la region situee entre 
le gene D et l'IR2. 

12 - Vecteur selon la revendication 10 caracterise en ce que le plasmide 
pKWl est linearise au niveau des sites Clal(l). Pstl(4608) ou EcoRV(3072). les 

5 positions etant donnees par rapport a la figure 3. 

13 - Vecteur selon 1'une quelconque des revendications 4 a 12 caracterise 
en ce qu'il contient en outre une sequence d'ADN heterologue comprenant un gene 
de structure au moins sous le controle de signaux permettant son expression. 

14 - Vecteur selon la revendication 13 caracterise en ce que les signaux 
0 d'expression sont constitues par un ou plusieurs elements choisis parmi les 

promoteurs. les terminateurs, et les signaux de secretion. 

15 - Vecteur selon la revendication 14 caracterise en ce que les promoteurs 
sont regulables. 

16 - Vecteur selon la revendication 14 caracterise en ce que les promoteurs 
5 derivent de genes de levure, et preferentiellement de genes glycolytiques de levure. 

17 - Vecteur selon la revendication 13 caracterise en ce que le gene de 
structure code pour un polypeptide d'imeret pharmaceutique ou agroalimentaire. 

18 - Vecteur selon la revendication 13 caracterise en ce que le gene de 
structure code pour une proteine hybride. 

1 9 - Vecteur selon la revendication 1 3 caracterise en ce que le ou les genes 
de structure sont des genes imervenant, au niveau genetique ou biochimique, dans 
la biosynthese d'un metabolite. 

20 - Vecteur selon la revendication 4 caracterise en ce qu'il contient en 
outre un replicon E.coli . 

21 - Vecteur selon la revendication 4 caracterise en ce qu'il contient en 
outre un marqueur de selection au moins. 
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22 - Cellule recombinee contenant un vecteur selon Tune quelconque des 
revendications 4 a 21. 

23 - Cellule selon la revendication 22 caracterisee en ce qu'il s'agit d'une 

levure. 

5 24 - Cellule selon la revendication 23 caracterisee en ce qu'il s'agit d'une 

levure du genre Kluweromyces ou Saccharomyces . 

25 - Procede de preparation d'un polypeptide caract6ris6 en ce que Ton 
cultive une cellule recombinee selon l'une des revendications 22 a 24 et on recupere 
le polypeptide produit. 

10 26 - Procede selon la revendication 25 caracterise en ce que le polypeptide 

est choisi parmi les enzymes (telles que notamment la superoxide dismutase, la 
cat ai as e, les amylases, les lipases, les amidases, la chymosine etc.), les derives 
sanguins (tels que la serum-albumine, 1'alpha- ou la beta-globine, le facteur VIII, le 
facteur IX, le facteur van Willebrand, la fibronectine, l'alpha-1 antitrypsine etc.), 

15 1'insuline et ses variants, les lymphokines [telles que \ les interleukines, les 
interferons, les facteurs de stimulation des colonies (G-CSF, GM-CSF, M-CSF...), 
le TNF, le TRF etc.], les facteurs de croissance (tels que rhormone de croissance, 
l'erythropoietine, le FGF, TEGF, le PDGF, le TGF etc.), les apolipoproteines, ou 
encore des polypeptides antigeniques pour la realisation de vaccins (hepatite, 

20 cytomegalovirus, Eppstein-Barr, herpes etc.). 

27 - Procede selon la revendication 26 caracterise en ce que le polypeptide 
est Talbumine humaine ou un de ses variants ou precurseurs. 

28 - Utilisation d'une cellule recombinte selon Tune des revendications 22 
a 24 comme catalyseur dans une reaaion de bioconversion. 
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1 10 ' 20 ' 40 , 50 | 60 

1 ATCGATTGCC AGCAACAGGG TTTTGCGCGT ATGTCTCTTG TGGATACTAT GTAAACAAAA 60 
61 CAATCAATGT ACAAAGAGCA CAGCGGCCGG CAGGTGGGAG GACCCTCTGA TGAGCCGGGG 120 
121 ATATGGCGCT CCCGCGCGTC TAATATCCGG ATTGGACTGG AGGAGGACCA AGGTTTCCTC 180 
181 GAGGTCATGT GCCGCATCAT GAGGGACGAA AAATGGTAAG GAATAGACCA TTCCTTACCA 240 
2«1 TTTTTCGTCG CCCGTGAGAT TTTCCCATTT CCCGTTCCTT ACCATTTTTC GTTCCGCACG 300 
301 ACCCTATCAC ATTGTATATT GAAATCTACT TCCCTTCATA CCGCWGGCC ATCGCGTAGG 360 
361 AATGAACATA TGIAGCCCCI CTAGTTCCTC ATGTTGTTCT CAATCGACCC TTCCATCGTG 420 
421 AAGGGATCTC CTCTTGAGGC AATGTCGACG TTCGTACCCT CTTCCTACGG GTCACGGGTT 480 
481 CGTCTGTAAC ACTTCTTCTT GGTCTCCCTC GGCCTCTTTT ACTIGGCTGT GGCCTGGTAT 540 
541 TTTTGAGTXC AICGAATAGG CGCGGGTTTT CTTTTACTTG AGGCCAGTCT TGAATCTCTG 600 
601 AACCGAGAGA GGTTAGAGAA GTIATTCTTT TTAGATCATT TAACATGTCC TTGATGTCTT 660 
661 CTGGCGTTGT TTCGAAGCAC ATCAGTCCCC TTGAGCGATA TCTGTCGTAA TTTGCCAGTA 720 
721 TTACGTTGTG CGCTTCTTCC ATGTTTTCAG GGGCCACATG CTTTAATGCC TGCACTAAAA 780 
781 CACTTCTGAC AAGTGACCAA TCTGCGAATG CAGGCTCGTT CGCCAATATC AATCTCTGTA 840 
841 GAGGAACACC ACGATAGCTT GTTGTGCCCT TGCAGATAGT GTTCAAGAAT AGACTGAGGT 900 
901 A6CCACGTAC GTCGAGCTTT ACAGACCTGG TGCCAACGCC AGAAAGAAGG GCGAAGGGGT 960 
961 CCTCTTCAAT CGGAAAACGG GTCA6GCTAT CCACACGGTA CTCTCTATAT GTACTACGAG 1020 
1021 TCATCGTCGT GTACTTTGCG AAGTGCAGGC CGTGGCGATT ATAGTCAATC TGGAAAGAAT 1080 
1081 CCTGCTCATG TGGCTCTTTC TCCCCATTAT CCTCTTCAGA GTTCAGCGAG CCAGATGGCA 1140 
1141 GCTCGGCTGG CTCTCGCAGG TACGTGGGAT CGGGCTCACC TCGATCCACC GTCATCTCAT 1200 
1201 CAAGATTGCA CATAATCTGC ATCAGTCTCA ACGTCATATC GACCGCGGAA AAGGCGTCCG 1260 
1261 AGTAGGAAAC ATGCAGTTTG GAAAGGTCTA ACAGCTTGAG GCAGTGCATC TTGGCCTCTC 1320 
1321 TCTCTGTCAG TCTTTCTCTG TTTTGACCAA TTTTTCTCAA GT6TATTACA TTIGTTTCTT 1380 
1381 GGATTGCAAA AATGTTGCGA GTACTGCGTG TTCTCGTTCA AAAACAGCGT TCGCTGAAAA 1440 
1441 TTTAGGAGTT CAGATGCAAC GCGTAGTGCA AATGGAGGAT ICAAGTTGCA GTAACAATAA 1500 
1501 CATGGAACAC CAAGGATCAG TGTTCGAGGA GCTTATCTCC AAAAATCTTA TGAGCCXGAT 1560 
1561 GGAAGAATTG ATGTCTATGC TCACTAATGA GAAGGAGITC CAACGTGAAA GGTTCGCGTC 1620 
1621 TCTCCTAGCC TACATGATAA TGGCTACTGG TGAATTGGAA GAGAAAAAGC TCAGTACATT 1680 
1681 TACCAAGTAT TCCCGACGGA ICAGGCAGAC GGTAGAGTTC GACAGCAACA ACCAAATCGT 1740 
1741 AAGAITTGAG TACCATTTGA AGAATCCCAC AGAGCTCAAG GAGACGCTGG ACAAGGCCTT 1800 
1801 IAAACCTGTC GTGTTTGAAA TCAAGTCCAA AAAGAAGGTT GTCTCCATGC TGGAGCTAGC 1860 
1861 TGCGAAGCTC GACAAAAGGG GATCAGATTC AGCGGGTGGT ACGGTAGCTA GTGAGGTCTC 1920 
1921 GAAGCTTGTG CGG6AGGAAG AAATTTGGCT TCTTCTCGTG AACGTGAAGA ATACTATCCA 1980 
1981 GGAAAAGGTG CGCAAATCAT CGCTAAGAGC GGAATTGACG TATATTTTGA CAGCCTCATT 2040 
2041 CTTCAATT6T TGCAGACATA GCGATCTCAG GAACGCAGAC CCCGCAACAT TTGAGCTGGT 2100 
2101 GCCAAATAAG TATGTGGGCC ACGTTGTCCG GGTTTTGGTG TGCGAGACCA AGACCCGAAA 2160 
2161 GCCGCGGTTC ATATACTTTT TCCCTGTCAA TACGGCCGCG GATCCTCTAG TAGCGCTTCA 2220 
2221 TGATTTGTTC TCGAGCACGT TTCCTTCCAA AAAGAGTCGG ACGTCCGAAA GAAAGCAGGA 2280 

Figure 3 (a) 
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2281 ACAGGAATGG CAGATCGTTC GCGACGCATC AATCAACAAC TATGACCGGT TTGTTGGTAA 2340 
2341 GCACGCTACG 6AATCTGTCT TTGCCATCTT GCATGGTCCC AAATCACACT TGGGCCGGCA 2400 
2401 CTTGATGAGT TCCTACTTGG CGTATACCCA CCATGGGGAA TGGGTCTCAC CATATGGGAA 2460 
2461 TT66TCAGCT GGGAAAGGAA CCATTGAAAG CAGCGTGGCA AGGGCCAAGT ACGCACATGT 2520 
2521 TCAAGCCGAG ATCCCAAGCG ATCTTTTCGC CTTTCTGTCT CAGTACTATC AGGAATCAAA 2580 
2581 ATCGGGCGAT TTCGAGCTTA ACGACACCAG CAAAGACCCA ACAAAGCTGG TACGGCACTC 2640 
2641 GGCTAGTCAA CTGGAAATCA ATCGAACCTA TGGTCCATGG AGTAGATTGG TTAACAAGGA 2700 
2701 TGTTTTAGGC TTTGTTCATT CCTACGCGAT GGCCAAGCGG TATGAAGGGA AGTAGATTTC 2760 
2761 AATATACAAT GTGATAGGGT CGTGCGGAAC GAAAAATGGT AAGGAACGGG AAATGGGAAA 2820 
2821 ATCTCACGGG CGACGAAAAA TGGTAAGGAA TGGTCTATTC CTTACCATTT TTCGTCCCTC 2880 
2881 ATGATGCGGC ACATGACCTC GAGGAAACCT TGGTCCTCCT CCAGTCCAAT CCGGATATTA 2940 
2941 GACGCGCGGG AGCAGCCTAT CCCCGGCTCA TCAGAGGGTC CTCCCACCTG CCGGCCGCTG 3000 
3001 TGCTCTTTGT ACATTGATTG TTTTGTTTTA GTATTACCTG ACAATCATTT TATATTTTGT 3060 
3061 CAGTATTTCT TGATATCTGG CCCAAATGAA AGTACAAATA CAAGTACAAG TACAACACCT 3120 
3121 ATTCATTGTT ACCGTATCTC TATACTATTA TCCTTATTTC CTGCCTAATT AACTACTTTC 3180 
3181 TACCGGTGCG TTCTTAAAGC T6AGTAGGCA CTTCAGCCCG AAGTGAATAT CGCTGGCCTC 3240 
3241 ATTATCTGTT TGTTGTATGG CCAATGAAAC TCCAACCGAT TTGATCCACT TGCAAGGACC 3300 
3301 GTAGGATAGA CTTATTTTTA CCATCCCATT ATCTGTGCAG TGGACACCTC TGTTTATCTT 3360 
3361 TACCCGCCCT TCAGAGAACA IAATCTGTCT TACAAAAGAG TAGACCTCAT TTTTGGCGAG 3420 
3421 AAGCCTCTTC TGTTIGACCT CATCTAGAAG CTTTTGGGCT CTCCCAGCGC AATCAGATAG 3480 
3481 TCTIGTGAGA GIGTCCTCTT CGTCACCATG CTCATCAGAA GGAGCTGGTT GCGTTCCAAT 3540 
3541 TGAGAAAGCT CGTCCCAAAA GGCTGCATGG TCTATAGGTG GTCCCGAACC CGAGGATTCA 3600 
3601 CCTTGAGACr CATTGTCCAC AGTAGGCTCC TGATCCTCTG CAGCAGCCGC TTGCTGAATG 3660 
3661 GATTCTGCTC TTGACATTAC CAT TTC GAGA AGCCATAGTC TTCGGATGGT TCTAGCAGAT 3720 
3721 CTTTCAACAT CCAAACTGGA ACCGAACCAT TGCCGACAAC TTATTCTAAC CTCAAGCTTT 3780 
3781 GAGAGGTTCT CATACTTGGA TTGTGCAGCC TCAAGATCCG TAAGTTCGGT GAAGAAATCT 3840 
3841 AAAGCTTCGC GTTTTGGACC TAACCGAATG ATGATTGGGT GCCGTTTTCG TGGATCCAGA 3900 
3901 AATGGTGTAA GCTCCTCTAT ACTATCATTC GTGGGACACT CTATCCCTTC CCCAATATGC 3960 
3961 TTCTTTACAA TAGAAGGTAG CTGCGTATAC TTGTTCCGAA CAACAAAGAT GXGACTCTCT 4020 
4021 AGCCGCTTTA CTATTGTGTT CAACACAACG TAGGGTTTTG GCCACTCAAA TGTTAATTCT 4080 
4081 GATCGAGCTG CTGATGCTGT GTTCTTGTTG ATCATGTATG AATAGTAGAA CAATGCCAAT 4140 
4141 TGAGGATGCT CACTGTATTC CTTAGGCAGT TTGGTGCTGC CATAAGGTGA CACCAGCTCC 4200 
4201 TTTAGCTGTG GAACATAGAG TACATCAACA GTTCCTACTA GACAACATTC CTTGAGACAA 4260 
4261 TTATGATAGC CATCATGGTC GGTTATCTTA GGTATTITTT GAGCTTCACT CATCTTCGAA 4320 
4321 GCAACCGTGA TAGATTCGAT TGAAGTTCAA ATTCTTATCT AGATGGTGTA TTTGTTTAIC 4380 
4381 ATAATTTACA ATACAGTCTG TTTTAATTTG CTCGAAGTTG CAGTGAAAGA TGTAAAAAGG 4440 
4441 GGCTTCATTT TGCACTACAG ACTTACCCTG ATGTAAAAAA TTTTCATCAT AAAAGCAATT 4500 
4501 TCTCGTATAC AAAATGCAGT TTGTTTCGTA TACAGCAAAG CATAGAATAC ACTGTACACT 4560 
4561 GCATTTTTAC TACAAGAAAA GTTTTTTTTG CTGCTGTGAC TGGAATGCTG CAGCAGTACC 4620 
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FIGURE A 
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No de la damandt internatic PCT/ 



MICRO-ORGANISMES 

Fauilla facultattva ralativa au mlcro^raamama mantlonn* *n papa 20 , u 0 na 10-11 



da la daacriptlon t 



A. IOIMTIFICATION OU Dt>OT> 

D'autraa dap6ta iont idantiflaa tur una fauilla aupplamantaira » Q 
Nom da Tinatitution da dap6t « 



Centraalbureau voor Schimmelcultures (CBS) 



Adraata da I'inttltutlon da ^ap6t (y compria la coda postal at la pay*) * 

Oosterstraat 1, P.O. Box 273 - 3740 AG BAARN (Pays-Bas) 



Data du d«p6t » 



4 JUIN 1991 



N- d'Ofdra • 



CBS 290.91 



En ce qui concerne les designations dans lesquelles un brevet europeen 
est demande, un echantillon du microorganisme depose ne sera 
accessible, jusqu'4 la publication de la mention de la delivrance du brevet 
europeen ou jusqu'a la date a laquelle la demande sera rejetfee, retiree ou 
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The present invention concerns a new yeast plasmid, as well as new cloning and/or 
expression vectors derived therefrom, their preparation and their use, notably for the production 
of recombinant proteins. The invention also concerns recombinant host cells containing such 
vectors. 

More specifically, the present invention concerns all or part of a new plasmid isolated 
from the yeast Kluyveromyces waltii or a derivative thereof, and the cloning and/or expression 
vectors constructed from it. 

During the past ten years, yeasts have become very promising host microorganisms for 
the production of heterologous proteins. 

In particular, the identification by Beggs et al. (Nature 275 (1978) 104) of the plasmid 2\i 
and vectors derived therefrom was one of the keys of the current development of the genetic and 
molecular study of the yeast Saccharomyces cerevisiae. Since that time, the 2|i system has 
allowed the introduction and the expression of heterologous genes in yeast to obtain proteins of 
pharmaceutical or agro food interest. However, plasmid 2\i and its derivatives can replicate 
effectively only in yeasts belonging to the species 5. cerevisiae and to some related species. 
Therefore, this system cannot be used for genetic manipulation in mos;t yeast species. Notably, it 
cannot be used in yeasts whose physiological properties, which are different from those of S. 
cerevisiae, would allow better-performing new applications and/or industrial uses. 

Different laboratories therefore have sought other plasmids in different yeast species. 
Thus, several circular plasmids have been found in the yeasts of the genus Zygosaccharomyces, 
and notably the plasmids pSRl and pSR2 (Toh-e et al., J. Bacteriol. 151 (1982) 1380); pSBl, 
pSB2, pSB3 and pSB4 (Toh-e et al., J. Gen. Microbiol. 130 (1984) 2527); and pSMl (Utatsu 
et al., J. Bacteriol. 169 (1987) 5537). A circular plasmid has also been found in Kluyveromyces 
drosophilarum: pKDl (Falcone et al., Plasmid 15 (1986) 248). 

All these plasmids present characteristics which they share with plasmid 2|i, notably 
inverted repeat sequences, and the existence of two possible isomeric forms due to a site-specific 
recombination site. 

However, these plasmids always present the drawback of having a narrow host spectrum. 
Thus, because of their specificity with respect to yeast hosts, these plasmids can only be used in 
a limited number of strains. 

The present invention is the result of the identification of a natural plasmid of the yeast 
Kluyveromyces waltii. This plasmid, called pKWl , is the first known natural plasmid of this 
yeast species. The plasmid has been purified from the strain K. waltii CBS 6430, and it has been 
mapped using restriction enzymes; the resulting map is presented in Figure 1 . 

An object of the invention thus consists of the plasmid pKWl isolated from the strain K 
waltii CBS 6430, or any fragment or derivative thereof. 
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In the meaning of the invention, the term derivative denotes plasmids which, in spite of 
some modifications, preserve the properties of the original plasmid. Notably, the modifications 
can take on the form of mutations or deletions concerning regions having a relatively large size. 
They can also be insertions or suppressions, for example, of cloning sites. 

The term pKWl fragment notably denotes the different genetic elements of this plasmid. 
It is more advantageous, to notably mention, as genetic elements of pKWl, the structural genes or 
parts thereof, functional promoter sequences, inverted repeat sequences, or sequences (IR) that 
allow replication (replication origin) or confer stability to the plasmid (stability locus). 

Indeed, the structural study of plasmid pKWl has allowed the detection of analogies with 
the plasmid 2\i of S. cerevisiae. Thus, 4 structural genes have been identified (see Figure 2), as 
well as a replication origin. Moreover, the cloning of pKWl in E. coli has allowed the isolation 
of 4 types of recombinant plasmids, corresponding to 2 isomeric forms of plasmid pKWl 
(forms A and B) cloned in the vector pKan21 in the two possible orientations (vector pKan21 is 
described in Example 3.1). These two forms are presented in Figure 1 . The existence of two 
isomeric forms indicates the presence of inverted repeat sequences. The study has thus shown 
that plasmid pKWl contains a pair of inverted repeat sequences each having a length of 0.3 kb, 
and two unique sequences of 2.5 and 2.3 kb, whose orientation distinguishes the two isomeric 
forms A and B. The molecular size of plasmid pKWl is thus approximately 5.5 kb. Different 
restriction sites have been detected, for example, the following sites: EcoRI, SphI, Sail, Clal, 
Nhel and Bgll. 

The complete nucleotide sequence of plasmid pKWl has also been determined (Figure 
3). The absence of homology between this sequence and that of known plasmids has been 
demonstrated, notably by hybridization experiments (see Example 2). The absence of 
hybridization under conditions of moderate stringency is characteristic of this difference in 
sequence. 

In a preferred embodiment, the invention relates to a plasmid comprising all or part of the 
sequence presented in Figure 3 or a derivative thereof. 

Moreover, the applicant has also shown that it is possible to use plasmid pKWl or 
fragments thereof to construct particularly stable cloning and/or expression vectors. 

Another object of the present invention thus consists of cloning and/or expression vectors 
characterized in that they comprise all or part of plasmid pKWl of fL waltii CBS 6430 
represented in Figure 1 , or a derivative thereof. 

A more specific object of the invention consists of a cloning and/or expression vector 
characterized in that it comprises at least one genetic element of plasmid pKWl . 

Because of the host spectrum of plasmid pKWl, the vectors of the invention can be used 
in species other than the natural host K. waltii. 
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• Advantageously, according to the present invention, plasmid pKWl is linearized at the 
level of a unique restriction site. 

A particularly interesting site in this regard is the unique Clal site located in position 1 in 
Figure 1. Indeed, the applicant has shown that this site allowed the use of plasmid pKWl to 
construct the cloning and/or expression vectors, by introducing at this level, for example, 
heterologous DNA fragments, while maintaining the stable replication of the vector obtained. 
This result is surprising to the extent that site Clal is located in structural gene B. 

The use of such neutral cloning sites thus allows the obtention of very stable vectors 
which are capable of staying in the transformed cells, even in the absence of any selective 
pressure. 

Advantageously, the vectors of the invention contain, in addition, a heterologous DNA 
sequence comprising at least one structural gene, under the control of signals allowing its 
expression. 

The signals allowing the expression of the structural gene(s) can consist of one or more 
elements chosen from promoters, terminators or secretion signals. It is understood that the 
signals are chosen as a function of the used host, the structural gene and the desired result. In 
particular, it can be preferable in some cases to use a promoter which can be regulated, allowing 
the decoupling between the growth phases of the hosts and the phase of expression of said 
structural gene(s). Similarly, the use of the peptide signal (secretion signal) can make it possible 
to increase the production rate of the desired protein and facilitate the purification step. 

It is preferred for the promoters used to be derivatives of yeast genes. Promoters of 
particular interests are those derived from glycolytic genes of yeasts of the genus Saccharomyces 
or Kluyveromyces. Notably, one can cite the promoters of genes coding for phosphoglycerate 
kinase of S. cerevisiae (PGK), glyceraldehyde-3-phosphate dehydrogenase (GPD), enolases 
(ENO), alcohol dehydrogenases (ADH). One can also cite promoters derived from strongly 
expressed genes, such as the lactase gene (LAC4) or the acid phosphatase gene (PH05). 

Moreover, these genes can be modified by mutagenesis, for example, to add additional 
transcription control elements, such as, notably, UAS ("Upstream Activating Sequence") regions. 

The structural gene which can be introduced into the vectors of the invention preferably 
codes for a polypeptide of pharmaceutical or agro food interest. For example, one can mention 
enzymes, such as, notably, superoxide dismutase, catalase, amylases, lipases, amidases, 
chymosine, etc.), blood derivatives (such as serum albumin, alpha- orbeta-globin, factor VIII, 
factor IX, van Willebrand factor, fibronectin, alpha- 1 antitrypsin, etc.), insulin and its variants, 
lymphokines (such as interleukines, interferons, colony stimulation factors (G-CSF, GM-CSF, 
M-CSF. . .), TNF, TRF, etc.), growth factors (such as growth hormone, erythropoietin, FGF, 
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EGF, PDGF, TGF, etc.), apolipoproteins, or antigenic polypeptides for the manufacture of 
vaccines (hepatitis, cytomegalovirus, Epstein-Ban, herpes, etc.). 

In a special embodiment of the invention, the structural gene can be a gene resulting from 
the fusion of several DNA sequences. The gene can notably be a gene coding for a hybrid 
polypeptide containing an active part associated with the stabilizing part. As an example, one can 
mention the fusion between albumin or albumin fragments and a receptor part of a virus receptor 
(CD4, etc.). 

In another embodiment, the heterologous DNA sequence can comprise several structural 
genes, notably genes involved, at the genetic or biochemical level, in the biosynthesis of a 
metabolite. The metabolite can be, in particular, an antibiotic, an amino acid or a vitamin. 

In a special embodiment, the vectors of the invention contain, in addition: 

- an E. coli replicon and/or 

- at least one selection marker. 

These elements allow the manipulation of the vectors of the invention in a much easier 
manner. 

Another object of the invention concerns recombinant cells containing a vector as defined 

above. 

The recombinant cells are preferably chosen from yeasts. 

The applicant has shown that the vectors of the invention can indeed be used either in K. 
waltii (the natural host of pKWl) or in yeasts of different species or even different genera. 
Notably, they can be used in other Kluyveromyces species or in Saccharomyces. Moreover, when 
strain K. waltii CBS 6430 is used as the host cell, homologous recombinations between the 
vectors of the invention and the resident plasmid pKWl can affect the stability of the vectors, 
and thus decrease the performances of the host/vector pair. To further improve the stability of the 
vectors of the invention in such a host/vector pair, the applicant has prepared a strain K. waltii 
pKWl" (KW18). This strain allows the optimization of the industrial use of the vectors of the 
invention (see Example 4). 

Different techniques can be used to introduce the vectors of the invention into the host 
cells. In particular, transformation (Bianchi et al., Curr. Genet. 12 (1978) 185) and 
electroporation (Delorme, Appl. Environ. Microbiol. 155 (1989) 2242) yield good results. 
However, it is clear that the invention is not limited to a particular technique. 

An object of the invention also consists of a method for the preparation of a polypeptide 
according to which a recombinant cell as defined above can be cultured and the produced 
polypeptide recovered. More specifically, the method of the invention allows the production of 
proteins of pharmaceutical or agro food interest, such as those indicated above. More 
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specifically, the method of the invention can be adapted to the production of human albumin and 
of its variants or precursors. 

In the case where the structural genes are involved in the biosynthesis of a metabolite, the 
recombinant cells can also be used directly in a byconversion process. 

Other advantages of the invention will become apparent after a reading of the following 
examples which must be considered to be illustrative and nonlimiting. 

Legend of the figures 

Figure 1 : Restriction map of plasmid pKWl . The inverted repeat sequences as well as the 
structural genes A-D are indicated. The positions indicated for the restriction sites correspond to 
the first nucleotide recognized by the enzyme. 

Figure 2: Study of the open frames of plasmid pKWl. The genetic elements indicated are 
localized at the following positions with reference to the sequence presented in Figure 3: Gene 
A: nucleotides 1454-2755; gene B: nucleotides 4948-54; gene C: nucleotides 389-1309 on the 
complementary strand; gene D: nucleotides 3444-43 1 3 on the complementary strand; IR1 : 
nucleotides 53-368; IR2: nucleotides 27 1 3-3028. , 

Figure 3: Nucleotide sequence of plasmid pKWl. The sequence represented corresponds 
to the B form of the plasmid. Position 1 corresponds to the first nucleotide of the sequence 
recognized by the enzyme ClaL Plasmid pKWl was fragmented by restriction enzymes, and the 
fragments were cloned in pTZl 8R (Pharmacia). The sequences of the cloned segments were 
determined using the 2 -strand Sanger method. 

Figure 4: Restriction maps of the shuttle plasmids YIPS and pKan2 1 . Ap: ampicillin 
resistance gene; Tc: tetracycline resistance gene; Km: kanamycin resistance gene (G418); LacZ: 
structural gene of p-galactosidase. 

Figure 5: Strategy of construction of the vectors pBNAl, pNEA2, pBNBl/A3, pNEBl, 
pXXY2 and pXXK3. See also Table 1. 

Figure 6: Restriction map of the vector pXXK3. 

Figure 7: Strategy of construction of the vectors pKWCl 1, pKWSl and pKWS14. 

Figure 8: Study of the stability of vectors pKWCl 1 and pXXK3 in the strain K. waltii 
KW18. In each case, a transformed clone was cultured in nonselective YPG medium for the 
indicated number of generations, and then aliquots of the culture were plated on YPG agar Petri 
dishes with and without G418, to determine the total number of cells and the number of cells 
resistant to G418. The stability corresponds to the % of resistant cells. 

Figure 9: Strategy of construction of the expression vector pXPHOS. Abbreviations: P = 
promoter, T = terminator, ss = secretion signal, CIP = Calf Intestinal Phosphatase, Km = 
kanamycin, E = EcoRI, H = Hindlll, S = Sail, B = BamHI, Sm = Smal. 
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Figure 10: Restriction maps of the vectors pXKNl 8 and pXPH05. Legend: see Figure 9. 

Figure 1 1 : Immunological detection of IL1 p produced by K. waltii. The molecular weight 
markers (KDa) are indicated on the left. Well 1: Reference IL-lp (100 ng); well 2: culture 
supernatant of the transformant pXKN18 (without IL-lp cassette); well 3: culture supernatant of 
the transformant pXPH05 treated with endo-N-acetylglucosamidase H; wells 4 and 5: 
supematants of the cultures of the transformants pXPH05 in LPi and HPi medium, respectively. 

Figure 12: Strategy of construction of the plasmid pYG65. 

Figure 1 3 : Strategy of construction of the plasmid pYG70. 

Figure 14: Strategy of construction of the plasmid pYG141 . aph: gene coding for 
aminoglycoside 3'-phosphotransferase, which confers resistance to kanamycin; bla: gene coding 
for the P-lactamase which confers resistance to ampicillin. 

Figure 15: Strategy of construction of the plasmid pYG142. 

Tables 1 and 2: Composition of vectors derived from pKWl according to the invention. 
(*) Cloning sites. 

Tables 3, 4 and 5: Transformation by the vectors of the invention of S. cerevisiae, K. 
waltii and different strains of Kluyveromyces, respectively. The stability of the transformants is 
expressed by the percentages of Ura+ cells after 10 generations of growth in nonselective YPD 
medium. The isonuclear strains K. waltii pKWl + and pKWl' are CBS 6430 and KW1 8, 
respectively. 



General cloning technique 

The classical methods of molecular biology, such as centrifugation of plasmid DNA in a 
cesium chloride-ethidium bromide gradient, digestion by restriction enzymes, gel 
electrophoresis, electroelution of DNA fragments from agar gels, transformation in E. coli, etc., 
are described in the literature (Maniatis et al., "Molecular Cloning: a Laboratory Manual," Cold 
Spring Harbor Laboratory, Cold Spring Harbor, N.Y., 1986; Ausubel et al. (eds.), "Current 
Protocols in Molecular Biology," John Wiley & Sons, New York 1987). 

In vitro mutagenesis directed by oligodeoxynucleotides is carried out according to the 
method developed by Taylor et al. (Nucleic Acids Res. 13 (1 985) 8749-8764) using the kit 
distributed by Amersham. Sequencing of nucleotides is carried out according to the dideoxy 
technique described by Sanger et al. (Proc. Natl. Acad. Sci. USA 74 (1977) 5463-5467). 
Enzymatic amplification of specific DNA fragments is carried out by the PCR ("Polymerase- 
catalyzed Chain Reaction") reaction under the conditions described by Mullis and Faloona 
(Meth. Enzym., 155 (1987) 335-350) and Saiki et al. (Science 230 (1985) 1350-1354), using a 
"DNA thermal cycler" (Perkin-Elmer Cetus) following the recommendations of the 
manufacturer. 
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Examples 

1) Isolation and purification of pKWl 

Strain CBS 6430 is cultured in 2 L of YPG medium (yeast extract 1%, Bactopeptone 1%, 
glucose 2%) with stirring at 26°C for approximately 1 8 h. The cells in the early stationary phase 
are harvested by centrifugation. 13-15 g of cell mass per liter are usually obtained. The cells are 
washed with 150 mL of 1M sorbitol containing 30 mg of zymolyase 20T (Kirin Breweries Co., 
Tokyo). After incubation at 30°C for 1 h, one adds to the suspension of protoplasts 5 mL of 10% 
sodium dodecyl sulfate and 5 mL of 0.5M EDTA, pH 7.0. The mixture is immediately 
vigorously stirred and incubated at 50°C for 1-2 h. Potassium acetate is added to the lysate to 
obtain a final concentration of 1M and the mixture is maintained in ice for 2 h. The precipitates 
formed are eliminated by centrifugation (Sorvall SS34, 15,000 rpm, 30 min). The supernatant, to 
which 2 volumes of 95% ethanol are added, is cooled in ice to precipitate the nucleic acids. The 
precipitates are collected by centrifugation, washed with ethanol at 70%, dried under a vacuum, 
and finely dissolved in 40 mL of 5 x TE (lx TE is lOmM tris-HCl, ImM EDTA, pH 8). After the 
addition of 40 g of CsCl in 5 mL of ethidium bromide (stock solution of 10 mg/mL), the mixture 
is centrifuged at 60,000 rpm for 6 h (Beckman, rotor 60 Ti). The fluorescent band of the plasmid 
DNA is located below the major band of the chromosomal DNA. The DNA of the plasmid is 
collected and subjected to the second centrifugation cycle in CsCl/ethidium bromide. The 
collected plasmid DNA is mixed with one volume of isopropanol which has first been 
equilibrated with 4M CsCl to eliminate the ethidium bromide. After several extractions with 
isopropanol, the DNA solution is dialyzed against 1 x TE. The volume of the solution can be 
reduced by dialysis against polyethylene glycol 6000 in flakes. 

2) Sequencing and studies of homologies 

Plasmid pKWl was sequenced using the method described by Sanger et al. (Proc. Natl. 
Acad. Sci. USA 74 (1977) 5463-5467). The complete sequence is indicated in Figure 3. 

The absence of a homology between this sequence and that of known plasmids was 
determined by molecular hybridization experiments: pKWl is labeled with 32 P and hybridized 
with the following plasmids, which were first immobilized on a nitrocellulose filter: 

- plasmid 2|i from S. cerevisiae, 

- pSRl, pSB3 and pSB4 from Z rouxii, 

- pSBl and pSB2 from Z bailii, and 

- pKDl from K. drosophilarum. 

The hybridization was carried out under moderately stringent conditions (0.6M Na , 
65°C, 1 8 h); none of the plasmids produced a positive signal of hybridization. 
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The other circular plasmids (pSBl , pSB4) whose sequences have not yet been described 
are also different from pKWl, in the molecular size, the length of the inverted repeats, and in 
their host species. 

3) Constructions of cloning vectors derived from pKWl 

Two types of recombinant molecules were constructed from pKW 1 . 

3.1 In the first type, different fragments of pKWl (corresponding, for example, to the 

genetic elements of pKWl) were introduced into shuttle vectors, and notably into the vectors 

YIp5 (Struhl et al., Proc. Nat. Acad. Sci USA 76 (1979) 1035) and P Kan21, represented in 

Figure 4. 

Plasmid pKan21 was constructed by insertion of the gene aph (Genblock, Pharmacia) 
which confers resistance to kanamycin (G418) in the form of a 1.25 kbp AccI fragment, in the 
Narl site of plasmid pUC19 (Viera and Messing, Gene 19 (1982) 259). Thus, pKan21 contains, 
in addition to aph, the gene bla which confers resistance to ampicillin and the replication origin 
of ColEl which allows replication in E. coli. The yeasts transformed by the vectors derived from 
pKan21 can be detected by their growth on a medium containing 200 ug/mL of geneticine 

(G418). \ 

Plasmid YIp5 is a derivative of plasmid pBR322 in which the gene URA3 from S. 
cerevisiae was inserted as a selection marker. The yeast, transformed by the derivatives of YIp5, 
is detected by its growth on a uracil-free medium. In the last case, the host yeast is an auxotroph 
which is deficient in orotidine-monophosphate carboxylase of the uracil synthesis pathway. 

The vectors of this first type are pBNAl, pNEA2, pBNBl/A3, pNEBl, pXXY2 and 
pXXK3 (Table 1 and Figure 4). 

- Vector pBNAl 

pKWl is digested with Bglll and Nhel (see Figure 5) and the DNA fragments are 
separated by electrophoresis. The 2.4-kbp fragment is recovered and inserted by ligation between 
the unique BamHI and Nhel sites in the tetracycline resistance gene of plasmid YIp5 (Yanish- 
Peron et al., Gene 33, 1985, 103-1 19), where the latter was first digested by BamHI and Nhel 
and repurified. The Bglll and BamHI ends are compatible for a specific ligation. E. coli, 
transformed by the ligation mixture, is selected on LB agar medium which contains ampicillin. 
The insertion is verified by replication of the transformants on LB agar medium containing 
tetracycline, as the latter are sensitive to this antibiotic. The structure of the plasmid is verified 
by extraction of the DNA from individual transformants and its analysis using restriction 
enzymes. For example, plasmid pBNAl, digested by PstL produces 3 fragments of 3.28, 3.15 
and 1.36 kbp: double digestion with Pstl/Nhel yields 4 fragments of 3.15, 2.3, 1.36 and 1.0 kbp. 



13 



- Vector pNEA2 

The 2.0 kbp Nhel-EcoRI fragment of pKWl (see Figure 5) is isolated and inserted 
between the two unique Nhel and EcoRI sites in the tetracycline resistance gene of YIp5, where 
the latter was first digested by these two enzymes. The ligation product is introduced into E. coli 
and the transformants which are resistant to ampicillin and sensitive to tetracycline are isolated. 
The plasmid is isolated, as in the case of pBNAl , from one of its transformants. The structure of 
the recombinant plasmid obtained is verified by restriction. For example, digestion by PstI 
produces 2 fragments of 4.35 and 3.15 kbp; double digestion with Pstl/Xhol produces 4 
fragments of 3. 1 5, 1 .8, 1 .75 and 0.7 kbp. 

- Vector pXXY2 

The 545 bp Xhol-Xbal fragment of pKWl (see Figure 5) is isolated and inserted between 
the unique Sall-Nhel sites in the tetracycline resistance gene of plasmid YIp5. The Xhol and Sail 
ends, on the one hand, and Xbal and Nhel ends, on the other hand, are compatible for a specific 
ligation. The ligation product is introduced into E. coli, and the recombinant plasmid is isolated 
as in the case of pBNAl . The structure of the plasmid obtained is verified by restriction. For 
example, digestion with EcoRI + Nrul produces two fragments of 4.5 and 0.96 kbp. 

- Vector pXXK3 

The 545 bp Xhol-Xbal fragment of pKWl (see Figure 5) is isolated and inserted between 
the unique Sall-Xbal sites (polylinker at the N terminal of LacZ) of plasmid pKan21 . The 
ligation mixture is introduced into E. coli, and the transformants, which are plated on LB 
medium containing X-gal and IPTG, are isolated as white colonies among blue colonies. When 
replicated on LB medium containing kanamycin, they grow well. These colonies are individually 
analyzed for their plasmid content. The plasmid obtained from one of the transformants presents 
the structure shown in Figure 6, which was verified by restriction. For example, digestion with 
BamHI + PstI produces four fragments: 2.5, 1 .3, 0.55 and 0.19 kbp. 

- Vector pBNBl/A3 

The 1.9 kbp Bglll-Nhel fragment of pKWl (see Figure 5) is isolated and inserted 
between the BamHI-Nhel sites of YIp5. The recombinant plasmid is isolated as in the case of 
pBNAl . The structure of the plasmid is verified by restriction. For example, digestion with PstI 
produces 3 fragments of 3. 1 5, 2.8 and 1 .36 kbp; double digestion with Pstl/Nhel produces 4 
fragments of 3. 1 5, 1 .8, 1 .36 and 1 .0 kbp. 
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- Vector pNEBl 

The 2.5 kbp Nhel-EcoRI fragment of pKWl (see Figure 5) is isolated and inserted 
between the Nhel-EcoRI sites of YIp5. The recombinant plasmid is isolated as in the case of 
pBNAl . The structure of the plasmid is verified by restriction. For example, digestion with PstI 
produces 2 fragments of 4.65 and 3. 1 5 kbp; double digestion with Pstl/Xhol produces 3 
fragments of 3.15, 2.9 and 1.75 kbp. 

3 .2 The second type of recombinant molecules contains the totality of the sequence of 
pKWl. To obtain these vectors, pKWl is linearized by a unique cut at a restriction site, allowing 
the introduction of heterologous DNA segments. Such segments can contain structural genes, 
included, for example, in expression cassettes and/or whole shuttle vectors, such as, notably, 
pKan2 1 or YIp5 (Figure 4). 

Examples of this type of vectors are pKWCl 1, pKWSl and pKWS14 (Table 2 and 

Figure 7). 

- Vector pKWS14 

The DNA of pKWl is digested by the restriction enzyme Sail j Plasmid pKan21, 
described above, is also digested by Sail (the unique Sail site is localized in the cloning multisite 
present in the LacZ gene). The two plasmids are ligated by DNA ligase. The ligation mixture is 
used for the transformation of E. coli JM83 as in the preceding case. The suspension of the cells 
transformed is plated on LB agar containing X-gal and IPTG. The white colonies, among the 
blue ones, are harvested individually. They are resistant to ampicillin and kanamycin. Their 
plasmid content is analyzed on DNA minipreparations as above. Plasmid pKWS14, isolated from 
one of the transformants, contains form A of plasmid pKWl and it has the structure shown in 
Figure 7. It is verified by restriction. For example, digestion with BamHI produces 3 fragments 
of 5.6, 2.6 and 1.2 kbp. 

- Vector pKWCll 

Plasmid pKWl is digested with Clal. Plasmid pKan21 is digested with Accl. They are 
repurified by treatment with phenol and precipitation with ethanol. The DNA of the two 
plasmids are mixed in approximately equal quantities and subjected to ligation with DNA ligase 
for one night. The ligation product is amplified in E. coli. The colonies of the transformants are 
white on LB medium containing Xgal and IPTG. They are resistant to kanamycin and ampicillin 
in the medium containing one or the other of these antibiotics. Plasmid pKWCl 1, isolated from 
one of the transformants, contains form A of plasmid pKWl and has the structure shown in 
Figure 7. It is verified by restriction. For example, digestion of the plasmid with BamHI 
produces 3 fragments of 5.6, 2.9 and 0.9 kbp. 
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- Vector pKWSl 

Plasmid pKWl and plasmid YIp5 are digested with Sail. The mixture is repurified and 
subjected to ligation. The ligation product is introduced into E. coli. Transformants which are 
resistant to ampicillin and sensitive to tetracycline are obtained. Plasmid pKWSl, isolated from 
one of them, contains form A of plasmid pKWl and it has the structure shown in Figure 7. For 
example, digestion of the plasmid with EcoRI yields two fragments of 8.3 and 2.7 kbp. 

4) Construction of a strain CBS 6430 pKWl" 

K. waltii CBS 6430 was first transformed by the recombinant plasmid pKWS14 (Table 2 
and Figure 7). The transformation method used is essentially that described by Chen and 
Fukuhara (Gene 69, 181 (1988)) using protoplasts. The transformants obtained are maintained 
for 75 generations on YPD agar medium 1 mg/mL G418 (YPD medium: yeast extract 10 g/L; 
peptone 20 g/L; glucose 20 g/L). They are then transferred to a liquid YPD medium without 
antibiotic, and maintained for 10 generations. 

Under these conditions (without selective pressure), plasmid pKWS14 is progressively 
lost. The colonies which are sensitive to G418 and which appear are collected and individually 
tested for the presence of the plasmids. The test consists of the extraction of cellular DNA, 
followed by electrophoresis of these DNAs on agar gel. The presence of plasmids is determined 
by staining with ethidium bromide. Among the colonies which have become sensitive to G41 8, 
25% were shown to lack any plasmid. One of these colonies was kept as a strain of K. waltii 
which lacked plasmid pKWl, and it was called KW18. 

5) Transformation of different yeasts 

5.1 Transformation of S. cerevisiae 

Among the different vectors described in Tables 1 and 2 and in Figures 4 and 5, some of 
those containing the marker URA3 were used to transform an auxotrophic strain ura3 of S. 
cerevisiae (strain S150-2B: Mat a, ura3, leu2, trpl, his3, 2u). 

The transformation method is essentially the one described by Sherman et al. (Yeast 
Genetics, Cold Spring Harbor, NY, 1986). 

The results obtained are indicated in Table 3. They show that the vectors of the invention 
are capable of timsfoirning the yeasts of the genus Saccharomyces. 

5.2 Transformation of K. waltii 

The transformation of K. waltii was carried out with vectors which cany the marker for 

kanamycin resistance. 
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The transformation method used is essentially the one described by Chen and Fukuhara 
(Gene 69 (1 988) 181) using protoplasts. It is clear that any other technique which allows the 
introduction of a DNA fragment in a microorganism can be used. 

The results obtained are presented in Table 4. 

They show that the vectors of the invention are capable of transforming the yeast K. 
waltii with a high frequency. 

Moreover, the stability study described in Figure 8 shows that vectors can be obtained 
from pKWl presenting a stability of 100% after 50 generations of growth in a nonselective 
medium. This is perfectly illustrated by vector pKWCl 1 . This study also shows that it is 
preferable, to obtain a relatively high stability, to use the vectors which comprise only the 
replication origin of plasmid pKWl in host cells having a resident pKWl plasmid. 

5.3 Transformation of other yeasts 

Vector pKWC 1 1 , which is highly stable and autonomous in K. waltii, was used to test the 
transformability of different yeast species, notably those belonging to the genus Kluyveromyces. 

The results are presented in Table 5. i 

The presence of vector pKWC 1 1 in the transformants was verified by electrophoresis. 

All of these results show that the range of host species for the vectors of the invention can 
be very large, beyond the genus Kluyveromyces. 

6) Use of the vectors of the invention for the production of heterologous proteins 
6.1 Interleukin-ip: 

6.1 .1 Construction of an expression and secretion vector of IL-1 P derived from pKWl 
(Figures 9 and 10). 

- Vector pXXK3 (Table 1 , Figure 6) is linearized by EcoRI, and the ends are filled with 
the Klenow fragment of DNA polymerase I of E. coli. A synthetic "linker" (S'-GCGGCCGC-SO 
forming a restriction site which is recognized by the enzyme NotI is added by means of T4 
ligase, and the vector so obtained (pXKN 1 8) is purified after its amplification in E. coli 
(Figure 10). 

- An expression cassette of IL-1 p is prepared, consisting (a) of the regulated promoter 
PH05 originating from S. cerevisiae (Bajwa et al., Nucl. Acid. Res. 12 (1984) 7721-7739), (b) 
the gene of human IL-1 P (Jung et al., Ann. Inst. Pasteur/Microbiol. 139 (1988) 129-146) 
preceded (c) by a synthetic sequence corresponding to the signal sequence of the killer toxin of 
pGKLl of K. lactis (pre region of the gene of the alpha subunit) (Stark and Boyd, EMBO J. 5, 
(1986) 1995-2002), and (d) by the terminator PH05. The expression cassette was isolated from 
the vector pSPH05-IL14 whose construction is described in the patent EP 361991 . The cassette 
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was prepared as follows: At the 5' end of the gene coding for the mature part of IL-1 P, the 
following synthetic sequence is inserted, in the form of an EcoRI fragment: 

MetAsnllel^eTyrllePheLeuPheLcuLeuSerPheValGlnGlyLysArg 
5 , -A^TTATGAATATATTTTACATATTrTTGTTrrTGCTGTCATTCOTTCAACCTAAAAG-3' 
3'-TACTTAT AT AAAATGTATA AA A ACAAAAACG ACAGTAAGCAAGTTCCA I iJH.iJAA-5' 

The last codons added (Lys and Arg) form a potential restriction site which is recognized 
by the endopeptidase Kexl ofK. lactis (Tanguy-Rougeau et al.; FEBS Lett. 234 (1988) 464). 
This sequence was fused to the IL-1 p gene by the EcoRI site, forming the following junction: 

Gly Lys Arg He His Met Ala 
5\...GGT AAA AGA ATT CAT ATG GCA ....y 

Alanine (GCA) corresponds to the first amino acid of mature IL-1 p. Arg-Ile-His-Met 
corresponds to an EcoRI-Ndel "linker- introduced to facilitate the cloning (see EP 361 991). 

The entire cassette is put in the form of a NotI fragment by the addition of a 
corresponding linker (5'-GCGGCCGC-3'). 

- The secretion cassette of IL- 1 p is inserted, at the NotI site, in pXKNl 8. The resulting 
vector is called pXPH05 (Figure 10). 

6.1.2 The strain/:, waltii CBS 6430 is transformed with vector pXPH05, under the 
conditions described in Example 5.2. 

6. 1 .3 Expression of IL- 1 P: 

The transformed cells are cultured at 28°C, in the absence of G41 8, in the liquid medium 
LPi (low mineral phosphate content) and the medium HPi (high phosphate content), prepared 
according to Chen and Fukuhara (Gene 69 (1988) 181-192), for 4 days. 50 mL of culture are 
centrifuged and the supematants are filtered through a Millipore membrane (0.22 um). The 
proteins are precipitated by the addition of ethanol at the final concentration of 60%. The 
precipitates are dissolved in 2 mL of Laemmli buffer (Nature 227 (1970) pp. 680-685) and 
20-uL samples are used for SDS-PAGE analysis according to Laemmli (document cited above). 
After the electrophoresis, the proteins are transferred to a nitrocellulose sheet, and treated with a 
polyclonal anti-human IL-1 p rabbit antiserum. The blot is then treated with a second biotinylated 
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anti-rabbit polyclonal antibody (Vectastain ABC ImmunoPeroxydase Kit, Vector Laboratories). 
The antigen-antibody complex is developed according to the protocol of die supplier. 

Figure 1 1 shows that a protein having an apparent molecular weight of 21 kDa is secreted 
by the yeast transformed by pXPHOS. The protein is specifically recognized by the anti-IL-1 (J 
antiserum. This protein is not synthesized by the yeast transformed by the control vector 
pXKN18 (without IL-lp cassette). The secreted protein corresponds to the glycosylated form of 
IL-ip, which is demonstrated by the reduction of the apparent MW after treatment with the 
enzyme endo-N-acetylglucosamidase H (Figure 1 1 , lane 3). This host/vector pair K. 
>va/////pXPH05, which is not yet optimized, secretes approximately 5 mg of IL-lp per liter of 
culture. The level of secretion of IL-lp by K. waltii is higher in the LPi medium than in the HPi 
medium, which suggests that the activity of the PH05 promoter is regulated by the phosphate in 
K. waltii, as in S. cerevisiae. 

6.2 Human serum albumin: 

6.2.1 Construction of plasmid pYG140 (Figures 12-14). 
A plasmid was constructed which comprises: 

- an E. coli replicon, 

- the gene aph under the control of the promoter kl of the killer toxin of K. lactis 
(EP36191 1) in which the Hindlll site was eliminated by directed mutagenesis, and 

- the gene bla, which confers resistance to ampicillin. 

- the gene aph, under the control of the promoter kl, is isolated from plasmid pKan707 
(EP361991) in the form of a fragment PstI, which is cloned in the equivalent site of the phage 
M13mp7. The resulting plasmid is called pYG64 (Figure 12). The Hindlll site present in this 
gene was destroyed by direct mutagenesis according to the method described by Taylor et al. 
(Nucl. Acid. Res. 13 (1985) 8749). The resulting plasmid is called pYG65. The 
oligodeoxynucleotide having served for the mutagenesis has the following sequence: 5- 
GAAATGCATAAGCTCTTGCCATTCTCACCG-3 1 , and it allows the transformation of the 
triplet CTT coding for leucine 1 85 in CTC. To construct plasmid pYG70, the part containing the 
bacterial replicon of vector pKan707 was isolated by digestion with the enzyme EcoRI and 
recircularization with T4 DNA ligase to obtain pYG69. The fragment PstI present in the latter 
vector containing gene aph was then replaced by the mutated equivalent fragment originating 
from pYG65. The resulting plasmid is called pYG70 (Figure 13). 

This plasmid is then digested by EcoRI and relegated in the presence of an EcoRI-Narl- 
EcoRI adapter containing the following sequence: 5VAATTCGGCGCCG-3 1 . 
The plasmid obtained is called pYG140 (Figure 14). 
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6.2.2 Introduction of an expression cassette for albumin (Figure 14) 

The gene coding for preproSAH under the control of the promoter and the terminator of 
the gene PGK of S. cerevisiae was isolated in the form of an Sall-SacI fragment from an 
expression vector pYG19 (EP361991). This fragment was introduced into the corresponding 
sites of plasmid pYG 1 40 to generate plasmid pYG 141. 

6.2.3 Construction of expression vector pYG142 (Figure 1 5) 

Plasmids pYG141 and pKWl are digested by the enzymes Narl and Clal, respectively. 
After the ligation, 4 recombinant plasmids are obtained because of the existence of 2 forms, A 
and B, of pKWl, and of the orientation of the pKWl part with respect to the pYG141 part. 

Figure 15 describes the restriction map of one of these 4 plasmids: pYG142, containing 
the form B of pKWl. 

The other plasmids are called pYG143, pYG144 and pYG145. 

One sample of the strain K. lactis CBS 6430 was deposited at the CBS in Baarn 
(Netherlands) pursuant to the conditions of the Treatise of Budapest, on June 4, 1991 under the 
number CBS 290.91. \ 



Table 1 



Vectors 


Fragment of pKWl 


Shuttle vector 


Marker 


pBNAl 


Bglll-Nhel 


Yip5 


URA3 


2.4Kb 


*BamHI-NheI 




pNEA2 


Nhel-EcoRI 


Yip5 


URA3 


2.0kb 


Nhel-EcoRI 




pXXY2 


Xhol-Xbal 


Yip5 


URA3 


0.55 kb 


Sall-Nhel 




pXXK3 


Xhol-Xbal 


pKan21 


Kan R 


0.55 kb 


Sall-Xbal 




pBNBl/A3 


Bgllll-Nhel 


Yip5 


URA3 


1.9 kb 


BamHI-Nhel 




pNEBl 


Nhel-EcoRI 


Yip5 


URA3 


2.5 kb 


Nhel-EcoRI 





Table 2 



Vectors 


Linearization site of 
pKWl 


Shuttle vector 


Marker 


pKWS14 
Pkwcll 
PKWS 1 


Sail 
Clal 
Sail 


P Kan21*(SalI) 
pKan21 (AccI 
Yip5 (Sail) 


Kan R 
Kan R 
URA3 


Table 1 Transformation of Saccharomvces cerevisiae by vectors derived from pKWl 


Vectors 


Transformants Ura+ per of DNA 


pKWSl 
pBNAl 
pBNBl/A3 
pXXY2 
pSKl 


4 400 
1 200 
7 600 
4 000 
4 500 


Tahle 4 Transformation of Kluweromvces waltii by vectors derived from pKWl 


Vectors 


Replication support 


Transform ants C 
per ug ol 

pKWl + 


}418-resistant 
"DNA 

pKWl" 


pKWCll 
pXXK3 
pKWS14 


pKWl total 

Xbal-Xhol 
540bpdepKWl 
pKWl total 


36 00 
(98%) 
35 000 
(49 %) 
10 000 
(92 %) 


8 000 
(100 % 
10 000 
(2,8 %) 
8 000 
(29 %) 









Frequency of 


Stability of the 


Species 


Strain 


GC% 


transformation 


transformants 






per ug of DNA 


(%) 


K. waltii 


CBS 6430 


45.6 


2400 


100 


K. thermotolerans 


CBS 6340 


46.2 


4000 


25 



21 



Claims 

1 . Plasmid pKWl isolated from the strain K. waltii CBS6430, or any fragment or 
derivative thereof. 

2. Fragment according to Claim 1, characterized in that it is a genetic element. 

3. Plasmid characterized in that it comprises all or part of the sequence presented in 
Figure 3 or a derivative thereof. 

4. Cloning and/or expression vector, characterized in that it comprises all or part of 
plasmid pKWl of K. waltii CBS 6430 represented in Figure 1 or a derivative thereof. 

5. Vector according to Claim 4, characterized in that it comprises a genetic element of at 
least plasmid pKW 1 . 

6. Vector according to Claim 5, characterized in that it comprises the replication origin of 
plasmid pKWl. 

7. Vector according to Claim 4, characterized in that it comprises the totality of plasmid 

pKWl. 

8. Vector according to Claim 4, characterized in that it comprises all or part of the 
sequence presented in Figure 3 or a derivative thereof. \ 

9. Vector according to Claim 4, 7 or 8, characterized in that plasmid pKWl is linearized 
at the level of a functionally neutral restriction site. 

1 0. Vector according to Claim 9, characterized in that it contains restriction site present 
on plasmid pKWl, or one which was artificially introduced to it. 

1 L Vector according to Claim 10, characterized in that it contains a restriction site 
artificially introduced into an intergenic region, and preferably in the region located between the 
genes B and D, or in the region located between gene D and IR2. 

12. Vector according to Claim 10, characterized in that plasmid pKWl is linearized at the 
level of the sites Clal(l), Pstl(4608) or EcoRV(3072), the positions being given with reference to 
Figure 3. 

1 3. Vector according to any one of Claims 4- 1 2, characterized in that it contains, in 
addition, a heterologous DNA sequence comprising a structural gene which is at least under the 
control of signals allowing its expression. 

14. Vector according to Claim 13, characterized in that the expression signals consist of 
one or more elements chosen from promoters, terminators, and secretion signals. 

1 5. Vector according to Claim 14, characterized in that the promoters can be regulated. 

16. Vector according to Claim 14, characterized in that the promoters are derived from 
yeast genes, and preferably from glycolytic yeast genes. 

1 7. Vector according to Claim 13, characterized in that the structural gene codes for a 
polypeptide of pharmaceutical or agro-food interest. 
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18. Vector according to Claim 13, characterized in that the structural gene codes for a 
hybrid protein. 

19. Vector according to Claim 13, characterized in that the structural gene(s) is (are) 
genes involved, at the genetic or biochemical level, in the biosynthesis of a metabolite. 

20. Vector according to Claim 4, characterized in that it contains in addition an E. coli 
replicon. 

21 . Vector according to Claim 4, characterized in that it contains in addition at least one 
selection marker. 

22. Recombinant cell containing a vector according to any one of Claims 4-21. 

23. Cell according to Claim 22, characterized in that it is a yeast cell. 

24. Cell according to Claim 23, characterized in that it is a yeast of the genus 
Kluyveromyces or Saccharomyces. 

25. Method for the preparation of a polypeptide, characterized in that a recombinant cell 
is cultured according to one of Claims 22-24 and the produced polypeptide is recovered. 

26. Method according to Claim 25, characterized in that the polypeptide is chosen from 
enzymes (such as, notably, superoxide dismutase, catalase, amylases, lipases, amidases, 
chymosine, etc.), blood derivatives (such as serum albumin, alpha- or beta-globin, factor VIII, 
factor DC, van Willebrand factor, fibronectin, alpha- 1 antitrypsin, etc.), insulin and its variants, 
lymphokines (such as interleukins, interferons, colony stimulation factors (G-CSF, GM-CSF, M- 
CSF. ..), TNF, TRF, etc.), growth factors (such as growth hormone, erythropoietin, FGF, EGF, 
PDGF, TGF, etc.), apolipoproteins, or antigenic polypeptides for the preparation of vaccines 
(hepatitis, cytomegalovirus, Epstein-Barr, herpes, etc.). 

27. Method according to Claim 26, characterized in that the polypeptide is human 
albumin or one of its variants or precursors. 

28. Use of a recombinant cell according to one of Claims 22-24 as a catalyst in a 
bioconversion reaction. 
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1 ATCGATTGCC AGCAACAGGG TTTTGCGCGT ATGTCTCTTG TGGATACTAT GTAAACAAAA 60 
61 CAATCAATGT ACAAAGAGCA CAGCGGCCGG CAGGTGGGAG GACCCTCTGA TGAGCCGGGG 120 
121 ATATGGCGCT CCCGCGCGTC TAATATCCGG ATTGGACTGG AGGAGGACCA AGGTTTCCTC 180 
181 GAGGTCATGT GCCGCATCAT GAGGGACGAA AAATGGTAAG GAATAGACCA TTCCTTACCA 240 
241 TTTTTCGTCG CCCGTGAGAT TTTCCCATTT CCCGTTCCTT ACCATTTTTC GTTCCGCACG 300 
301 ACCCTATCAC ATTGTATATT GAAATCTACT TCCCTTCATA CCGCTTGGCC ATCGCGTAGG 360 
361 AATGAACATA TGTAGCCCCT CTAGTTCCTC ATGTTGTTCT CAATCGACCC TTCCATCGTG 420 
421 AAGGGATCTC CTCTTGAGGC AATGTCGACG TTCGTACCCT CTTCCTACGG GTCACGGGTT 4 80 
4 81 CGTCTGTAAC ACTTCTTCTT GGTCTCCCTC GGCCTCTTTT ACTTGGCTGT GGCCTGGTAT 540 
541 TTTTGAGTTC ATCGAATAGG CGCGGGTTTT CTTTTACTTG AGGCCAGTCT TGAATCTCTG 600 
601 AACCGAGAGA GGTTAGAGAA GTTATTCTTT TTAGATCATT TAACATGTCC TTGATGTCTT 660 
661 CTGGCGTTGT TTCGAAGCAC ATCAGTCCCC TTGAGCGATA TCTGTCGTAA TTTGCCAGTA 720 
721 TTACGTTGTG CGCTTCTTCC ATGTTTTCAG GGGCCACATG CTTTAATGCC TGCACTAAAA 780 
781 CACTTCTGAC AAGTGACCAA TCTGCGAATG CAGGCTCGTT CGCCAATATC AATCTCTGTA 840 
841 GAGGAACACC ACGATAGCTT GTTGTGCCCT TGCAGATAGT GTTCAAGAAT AGACTGAGGT 900 
901 AGCCACGTAC GTCGAGCTTT ACAGACCTGG TGCCAACGCC AGAAAGAAGG GCGAAGGGGT 960 
961 CCTCTTCAAT CGGAAAACGG GTCAGGCTAT CCACACGGTA CTCTCTATAT GTACTACGAG 1020 
1021 TCATCGTCGT GTACTTTGCG AAGTGCAGGC CGTGGCGATT ATAGTCAATC TGGAAAGAAT 1080 
1081 CCTGCTCATG TGGCTCTTTC TCCCCATTAT CCTCTTCAGA GTTCAGCGAG CCAGATGGCA 1140 
1141 GCTCGGCTGG CTCTCGCAGG TACGTGGGAT CGGGCTCACC TCGATCCACC GTCATCTCAT 1200 
1201 CAAGATTGCA CATAATCTGC ATCAGTCTCA ACGTCATATC GACCGCGGAA AAGGCGTCCG 1260 
1261 AGTAGGAAAC ATGCAGTTTG GAAAGGTCTA ACAGCTTGAG GCAGTGCATC TTGGCCTCTC 1320 
1321 TCTCTGTCAG TCTTTCTCTG TTTTGACCAA TTTTTCTCAA GTGTATTACA TTTGTTTCTT 1380 
1381 GGATTGCAAA AATGTTGCGA GTACTGCGTG TTCTCGTTCA AAAACAGCGT TCGCTGAAAA 1440 
1441 TTTAGGAGTT CAGATGCAAC GCGTAGTGCA AATGGAGGAT TCAAGTTGCA GTAACAATAA 1500 
1501 CATGGAACAC CAAGGATCAG TGTTCGAGGA GCTTATCTCC AAAAATCTTA TGAGCCTGAT 1560 
1561 GGAAGAATTG ATGTCTATGC TCACTAATGA GAAGGAGTTC CAACGTGAAA GGTTCGCGTC 1620 
1621 TCTCCTAGCC TACATGATAA TGGCTACTGG TGAATTGGAA GAGAAAAAGC TCAGTACATT 1680 
1681 TACCAAGTAT TCCCGACGGA TCAGGCAGAC GGTAGAGTTC GACAGCAACA ACCAAATCGT 1740 
1741 AAGATTTGAG TACCATTTGA AGAATCCCAC AGAGCTCAAG GAGACGCTGG ACAAGGCCTT 1800 
1801 TAAACCTGTC GTGTTTGAAA TCAAGTCCAA AAAGAAGGTT GTCTCCATGC TGGAGCTAGC 1860 
1861 TGC6AAGCTC GACAAAAGGG GATCAGATTC AGCGGGTGGT ACGGTAGCTA GTGAGGTCTC 1920 
1921 GAAGCTTGTG CGGGAGGAAG AAATTTGGCT TCTTCTCGTG AACGTGAAGA ATACTATCCA 1980 
1981 GGAAAAGGTG CGCAAATCAT CGCTAAGAGC GGAATTGACG TATATTTTGA CAGCCTCATT 2040 
2041 CTTCAATTGT TGCAGACATA GCGATCTCAG GAACGCAGAC CCCGCAACAT TTGAGCTGGT 2100 
2101 GCCAAATAAG TATGTGGGCC ACGTTGTCCG GGTTTTGGTG TGCGAGACCA AGACCCGAAA 2160 
2161 GCCGCGGTTC ATATACTTTT TCCCTGTCAA TACGGCCGCG GATCCTCTAG TAGCGCTTCA 2220 
2221 TGATTTGTTC TCGAGCACGT TTCCTTCCAA AAAGAGTCGG ACGTCCGAAA GAAAGCAGGA 2280 
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2281 ACAGGAATGG CAGATCGTTC GCGACGCATC 'AATCAACAAC TATGACCGGT TTGTTGGTAA 2340 
2341 GCACGCTACG GAATCTGTCT TTGCCATCTT GCATGGTCCC AAATCACACT TGGGCCGGCA 2400 
2401 CTTGATGAGT TCCTACTTGG CGTATACCCA CCATGGGGAA TGGGTCTCAC CATATGGGAA 2460 
2461 TTGGTCAGCT GGGAAAGGAA CCATTGAAAG CAGCGTGGCA AGGGCCAAGT ACGCACATGT 2520 
2521 TCAAGCCGAG ATCCCAAGCG ATCTTTTCGC CTTTCTGTCT CAGTACTATC AGGAATCAAA 2580 
2581 ATCGGGCGAT TTCGAGCTTA ACGACACCAG CAAAGACCCA ACAAAGCTGG TACGGCACTC 2640 
2641 GGCTAGTCAA CTGGAAATCA ATCGAACCTA- TGGTCCATGG AGTAGATTGG TTAACAAGGA 2700 
2701 TGTTTTAGGC TTTGTTCATT CCTACGCGAT GGCCAAGCGG TATGAAGGGA AGTAGATTTC 2760 
2761 AATATACAAT GTGATAGGGT CGTGCGGAAC GAAAAATGGT AAGGAACGGG AAATGGGAAA 2820 
2821 ATCTCACGGG CGACGAAAAA TGGTAAGGAA TGGTCTATTC CTTACCATTT TTCGTCCCTC 2880 
2881 ATGATGCGGC ACATGACCTC GAGGAAACCT TGGTCCTCCT CCAGTCCAAT CCGGATATTA 2940 
2941 GACGCGCGGG AGCAGCCTAT CCCCGGCTCA TCAGAGGGTC CTCCCAtCTG CCGGCCGCTG 3000 
3001 TGCTCTTTGT ACATTGATTG TTTTGTTTTA GTATTACCTG ACAATCATTT TATATTTTGT 3060 
3061 CAGTATTTCT TGATATCTGG CCCAAATGAA AGTACAAATA CAAGTACAAG TACAACACCT 3120 
3121 ATTCATTGTT ACCGTATCTC TATACTATTA TCCTTATTTC CTGCCTAATT AACTACTTTC 3180 
3181 TACCGGTGCG TTCTTAAAGC TGAGTAGGCA CTTCAGCCCG AAGTGAATAT CGCTGGCCTC 3240 
3241 ATTATCTGTT TGTTGTATGG CCAATGAAAC TCCAACCGAT TTGATCCACT TGCAAGGACC 3300 
3301 GTAGGATAGA CTTATTTTTA CCATCCCATT ATCTGTGCAG TGGAckcCTC TGTTTATCTT 3360 
3361 TACCCGCCCT TCAGAGAACA TAATCTGTCT TACAAAAGAG TAGACCTCAT TTTTGGCGAG 3420 
3421 AAGCCTCTTC TGTTTGACCT CATCTAGAAG CTTTTGGGCT CTCCCAGCGC AATCAGATAG 3480 
3481 TCTTGTGAGA GTGTCCTCTT CGTCACCATG CTCATCAGAA GGAGCTGGTT GCGTTCCAAT 3540 
3541 TGAGAAAGCT CGTCCCAAAA GGCTGCATGG TCTATAGGTG GTCCCGAACC CGAGGATTCA 3600 
3601 CCTTGAGACT CATTGTCCAC AGTAGGCTCC TGATCCTCTG CAGCAGCCGC TTGCTGAATG 3660 
3661 GATTCTGCTC TTGACATTAC CATTTCGAGA AGCCATAGTC TTCGGATGGT TCTAGCAGAT 3720 
3721 CTTTCAACAT CCAAACTGGA ACCGAACCAT TGCCGACAAC TTATTCTAAC CTCAAGCTTT 3780 
3781 GAGAGGTTCT CATACTTGGA TTGTGCAGCC TCAAGATCCG TAAGTTCGGT GAAGAAATCT 3840 
3841 AAAGCTTCGC GTTTTGGACC TAACCGAATG ATGATTGGGT GCCGTTTTCG TGGATCCAGA 3900 
3901 AATGGTGTAA GCTCCTCTAT ACTATCATTC GTGGGACACT CTATCCCTTC CCCAATATGC 3960 
3961 TTCTTTACAA TAGAAGGTAG CTGCGTATAC TTGTTCCGAA CAACAAAGAT GTGACTCTCT 4020 
4021 AGCCGCTTTA CTATTGTGTT CAACACAACG TAGGGTTTTG GCCACTCAAA TGTTAATTCT 4060 
4081 GATCGAGCTG CTGATGCTGT GTTCTTGTTG ATCATGTATG AATAGTAGAA CAATGCCAAT 4140 
4141 TGAGGATGCT CACTGTATTC CTTAGGCAGT TTGGTGCTGC CATAAGGTGA CACCAGCTCC 4200 
4201 TTTAGCTGTG GAACATAGAG TACATCAACA GTTCCTACTA GACAACATTC CTTGAGACAA 4260 
4261 TTATGATAGC CATCATGGTC GGTTATCTTA GGTATTTTTT GAGCTTCACT CATCTTCGAA 4320 
4321 GCAACCGTGA TAGATTCGAT TGAAGTTCAA ATTCTTATCT AGATGGTGTA TTTGTTTATC 4380 
4381 ATAATTTACA ATACAGTCTG TTTTAATTTG CTCGAAGTTG CAGTGAAAGA TGTAAAAAGG 4440 
4441 GGCTTCATTT TGCACTACAG ACTTACCCTG ATGTAAAAAA TTTTCATCAT AAAAGCAATT 4500 
4501 TCTCGTATAC AAAATGCAGT TTGTTTCGTA TACAGCAAAG CATAGAATAC ACTGTACACT 4560 
4561 GCATTTTTAC TACAAGAAAA GTTTTTTTTG CTGCTGTGAC TGGAATGCTG CAGCAGTACC 4620 
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4621 TAGATAGAAX AATGGCATAA AACTGAAATT 
4681 TTTTTTCTCG CAAAAGTTTT CTACAAAAGC 
4741 ACAAGGCGTC TGAGCGCGTG ACTTGAGCGC 
4801 TGGGCCTCAG ACATCGGATC GACAGAAGAG 
4 861 CCACAACAAT CGAGAGATTA GTGGAArTCA 
4921 ACTCTTAGTT CTACATTCAG AATACGCATG 
4981 ATTGACCCTA TAATTCATCC CAAATCGTTC 
5041 TTTTTGGTTG CGATCCCCAT CAGCGCCTAT 
5101 GATGACTTAC AGGGGCATTT AACGGCGCGA 
5161 TACTTTCACA GACGCTGGGA GACACGAAAC 
5221 ATCCCAGAAT GGTCTCTCGG GTTACTGGAT 
5281 AGAGAACTGC GCGAACTATC TCAAAAATGG 
5341 TCTGGCAGGC TTCTTCTACA GCTTCTGTAC 
5401 TTCAATAAGQ TTTACTGCCT CGTCAAACTA 
5461 GCCCTTATGG ACTCTGTATT GAGACCACTT 
5521 GATGAAGAAA TACTTGATAA GATATGGTCC 
5581 AAACGTATAG CGGAAGCGTT GTCAGGCGAG 



TTATAGTCAT TTTTCGTGTC TTTCATTCAA 4680 
AGTCAAAATT GCAATAAGTA TACACTAATT 474 0 
GTGACGTAAT CGCGAGCTAC GAAAGTTGTT 4800 
GTAAGAATAT TGGGAAAGTA CATTCAATTA 4 860 
GTCATTAATG AAAGGTAGGG TAGTCCGCCT 4920 
CAGTCCTCAA GTTCTGATGA AGACGACCTA 4980 
TATAGGGCGG CTAACGAGAT ACCGAGAGAC 5040 
GTTTTTAGCG TATTTGCTAA ATCAGTACGA 5100 
GATATGGCAT TAGCTTATCG TGAACGGCAG 5160 
GACCAGCTTG AGATCCCAGA CTGGTCTGAG 5220 
CGCCCTCCTT GTATCACTGT GGATCTAGCA 5280 
ATCGGAGCAT TCGATCTGGG ATCGAAGATG 5340 
ACCCAGCTGT CATGCCCAAA TGAGGCTGTT 5400 
CTAAACAAGG ACGTAAATCG TGCGGACCGA 5460 
TTTGTCGAGA ATCCATACAT GGGTGAACTA 5520 
AATTTGACTG AAATGAGAAG TCAAGAGTGG 5580 
AATAATGAC o 
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